Best Available Copy 



ORGANISATION MONDIALE DE LA PROPRIETE INTELLECTUELLE 
Bureau international 




PCT 

DEMANDE INTERNATIONALE PUBLIEE EN VERTU DU TRAITE DE COOPERATION EN MAT1ERE DE BREVETS (PCT) 



(51) Classification Internationale des brevets 6 
C07K 14/00 



A2 



(11) Numero do publication Internationale: WO 99/67282 
(43) Date de publication internationale:29 deccmbrc 1999 (29.12.99) 



(21) Numero de la demandc Internationale: PCT/FR99/01495 
22) Date de depdl international: 22 join 1999 (22.06.99) 



(30) Donnees relatives a la prioriti: 

98/08094 25 join 1998 (25.06.98) 



FR 



(71) DCposant (pour tous les Etats disignes sau/US): CENTRE NA- 
TIONAL DE LA RECHERCHE SCIENTiFIQUE (CNRS) 
[FR/FR]; 3, rue Michel Ange. F-75794 Paris Cedex 16 (FR). 

(72) lnventeurs; ut 

(75) Inventeurs/Deposants (US seutemcru): CLEMENT, Jean-Luc 
[FR/FR J; 550, rue Paradis, F- 13008 Marseille (FR). 
TIRARD. Alain [FR/FR); Chcmin de la Floride, F-83640 
Saim-Zacharie (FR). RENUCCI, Marielle [FR/FR); 1 1, rue 
Dumont d'Urvillc, F- 13005 Marseille (FR). BELA1CH, 
Anne [FR/FR]; Villa 8, 33, rue Floralia, F- 1 3009 Marseille 
(FR). MATARAZZO, Vatery [FR/FR]: 4, rue du Calcaire. 
F- 1 3360 Roquevairc (FR). 

(74) Mandataircs: BREESE, Pierre etc.; Brcese-Majerowicz, 3, 
avenue de POpdra, F-75001 Paris (FR). 



(81) Elats designes: AE. AL, AM, AT, AU. AZ, BA, BB. BG. BR, 
BY, CA. CH. CN. CU, CZ. DE, DK, EE, ES, Fl, GB. GD, 
GE, GH, GM, HR, HU, ID. IL, IN. IS, JP, KE, KG. KP. 
ICR, KZ, LC, LK, LR, LS, LT, LU, LV, MD, MG. MK. 
MN, MW, MX, NO, NZ, PL. PT, RO, RU, SD. SE, SG. 
SI, SK, SL, TJ, TM, TR. TT, UA, UG, US, UZ, VN, YU, 
ZA, ZW, brevet ARIPO (GH, GM, KE, LS, MW t SD, SL. 
SZ, UG, ZW), brevet eurasien (AM, AZ, BY, KG. KZ, MD, 
RU. TJ, TM), brevet europexm (AT, BE, CH. CY, DE. DK, 
ES, Fi, FR, GB, GR. IE. IT. LU, MC. NL, PT. SE), brevet 
OAPI (BF. BJ, CF, CG. CI, CM, GA. GN, GW, ML. MR. 
NE, SN. TD, TG). 



Publiee 



Sans rapport de recherche intcrrtaiionate, sere republiee des 
reception de ce rapport. 



(54) Title: NOVEL OLFACTORY RECEPTORS AND THEIR USES 
(54) Titre: NOUVEAUX RECEPTEURS OLFACTIFS ET LEURS UTILISATIONS 
(57) Abstract 

The invention concerns novel olfactory receptors, and the genes coding for said receptors. The invention also concerns the use of 
said receptors for detecting aromas, quality control, sample analysis or comparing perfumes, delecting toxic substances or trapping smells, 

(57) Abrege" 

La presente invention conceme de nouveaux recepteurs olfactifs, ainsi que les genes codant ces recepteurs. L* invention se rapportc 
aussi a I'utilisation de ces recepteurs pour la defection d'ar6mcs, le comrdlc de quality. Tanalyse d'dchantillons, r analyse ou la comparaison 
de parfums, la detection de substances toxiques, ou le pilgeage d'odturs. 



WO 99/67282 



30 



PCI7FR99/01495 



(i) CARACTERI ST IQUES DE LA SEQUENCE: 

(A) LONGUEUR: 528 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 19 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 42 : 



CAA 


GCT 


TTG 


GCG 


TAT 


GAC 


AGA 


TTT 


CTG 


GCC 


ATC 


TGT 


CAT 


CCT 


CTG 


CAT 


48 


TAT 


CTG 


GTC 


ATT 


ATG 


AGC 


CCT 


CGC 


CAT 


TGT 


GGC 


TTC 


TTA 


ACT 


TTG 


GTG 


96 


TCA 


TTT 


TTG 


CTG 


AGT 


CTT 


TTG 


GAC 


TCC 


CAG 


CTG 


CAC 


AGT 


TTC 


ATG 


ACC 


144 


TTA 


AAT 


ATT 


ACC 


AGC 


TTC 


AAG 


GAT 


GTG 


GAA 


ATT 


TCT 


AAT 


TTC 


TTC 


TGT 


192 


GAC 


CCT 


TCT 


CAA 


CTG 


CTG 


AAT 


CTC 


TCC 


TGT 


TCC 


AAC 


ACC 


TTC 


TCT 


GAT 


240 


AAC 


ATT 


GTC 


AAG 


TAT 


TTT 


CTG 


GGA 


GCC 


TTC 


TAT 


GGC 


CTT 


TTT 


CCC 


ATC 


288 


TCA 


GGG 


ATC 


CTT 


TTC 


TCT 


TAC 


TAC 


AAA 


ATT 


ATT 


TCC 


TCC 


ATT 


CTG 


AGG 


336 


ATC 


CCC 


TCC 


TTA 


GGT 


GGG 


AAG 


TAC 


AAA 


GCC 




TCC 


ACC 


TGT 


GGG 


TCT 


384 


CAC 


CTG 


GCA 


GTT 


GTC 


TGC 


TTA 


TTT 


TTA 


GTG 


ACA 


GCC 


TCC 


ACA 


GTG 


TAC 


432 


CTT 


GGA 


TCA 


GTT 


GCA 


TCA 


CAT 


TCT 


CCC 


AGA 


AAT 


GAT 


GTG 


GTG 


GCT 


TCT 


480 


CTG 


ATG 


TAC 


ACT 


GTG 


GTC 


ACC 


CCC 


ATG 


CTC 


AAC 


CCC 


TTT 


ATC 


TGC 


AGT 


528 



(44) INFORMATION POUR LA SEQ ID NO: 43 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 528 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 20 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 43 : 



CAA 


GCT 


TTG 
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CAT 


CCT 
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CAT 
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CCT 
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CAT 


TGT GGC 


TTC 


TTA 


ACT 


TTG 


GTG 


96 
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TTT 


TTG 


CTG 


AGT 


CTT 


TTG 


GAC 


TCC 


CAG 
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CAC 


AGT 


TTC 


ATG 


ACC 


144 


TTA 


AAT 


ATT 


ACC 


AGC 


TTC 


AAG 


GAT 


GTG 


GAA 


ATT 


TCT 


AAT 


TTC 


TTC 


TGT 


192 


GAC 


CCT 


TCT 


CAA 


CTG 


CTG 


AAT 


CTC 


TCC 


TGT 


TCC 


AAC 


ACC 


TTC 


TCT 


GAT 


240 


AAC 


ATT 


GTC 


AAG 


TAT 


TTT 


CTG 


GGA 


GCC 


TTC 


TAT 


GGC 


CTT 


TTT 


CCC 


ATC 


288 


TCA 


GGG 


ATC 


CTT 


TTC 


TCT 


TAC 


TAC 


AAA 


ATT 


ATT 


TCC 


TCC 


ATT 


CTG 


AGG 


336 


ATC 


CCC 


TCC 


TTA 


GGT 


GGG 


AAG 


TAC 


AAA 


GCC 


TTC 


TCC 


ACC 


TGT 


GGG 


TCT 


384 


CAC 


CTG 


GCA 


GTT 


GTT 


TGC 


TTA 


TTT 


TTA 


GTG 


ACA 


GCC 


TCC 


ACA 
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TAC 


432 


CTT 


GGA 


TCA 


GTT 


GCA 


TCA 


CAT 


TCT 


CCC 
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AAT 


GAT 


GTG 


GTG 


GCT 


TCT 


480 


CTG 


ATG 


TAC 


ACT 


GTG 


GTC 


ACC 


CCC 


ATG 


CTC 


AAT 


CCC 


TTC 


ATC 


TGC 


AGT 


528 
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(i) CARACTERISTIQUES DE LA SEQUENCE: 
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(54) TUre: NOUVEAUX RECEPTEURS OLFACTTFS ET LEURS UTILISATIONS 



(57) Abstract 

The invention concerns novel olfactory receptors, and the genes coding for said receptors. The invention also concerns the use of 
said receptors for detecting aromas, quality control, sample analysis or comparing perfumes, detecting toxic substances or trapping smells. 

(57) Abrege 

La presente invention conceme de nouveaux recepteurs olfactifs, ainsi que les genes codant ces recepteurs. L'invention se rapporte 
aussi a Tutilisation de ces recepteurs pour la defection d'arflmes, le contrOle de qualitd, Tanalyse d'echantillons, r analyse ou la comparaison 
de parfums, la detection de substances toxiqucs, ou le piegeage d'odeurs. 
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NOUVEAUX RECEPTEURS OLFACTIFS ET LEURS 
UTILISATIONS. 



5 La presente invention se rapporte a la mise 

en evidence de nouveaux recepteurs olfactifs chez la 
marmot te, au clonage et au sequencpage des genes codant 
pour ces recepteurs ainsi qu'a 1 * utilisation de ceux-ci 
pour le criblage de ligands et la preparation de 

10 biocapteurs. 

La decouverte recente de recepteurs 
olfactifs de vertebres bouleverse les strategies 
initialement envisagees pour la conception et la 
realisation de nez artificiel avec des capteurs physico- 

15 chimiques. En effet, au debut des annees 1990, les 

biologistes sont parvenus a isoler a partir d' epithelium 
olfactif de mammiferes et a sequencer les premieres 
proteines constituant des recepteurs olfactifs (3), et 
c'est en 1993 que le premier recepteur olfactif a ete 

20 exprime (7). Or, il est admis que l'hommme, qui est 

repute avoir un odorat limits, est capable de 
differencier plus de 10 000 molecules odorantes et que 
1% de son genome est compose de genes codant pour les 
recepteurs olfactifs (1) . On congoit done le champ 

25 d 1 investigation formidable qui s'ouvre aux chercheurs en 

matiere de capteurs biologiques potentiels. En outre, il 
apparait deja que ces capteurs biologiques ont une 
sensibilite superieure d'environ 100 000 fois aux 
meilleurs capteurs physico-chimiques existants (4, 6). 

30 Des travaux plus recents ont montre que ces detecteurs 

sont egalement sensibles a des molecules non biologiques 
(5). 

Tous les organismes vivants dependent 
35 d' informations sensorielles pour leur survie. Les 

perceptions sensorielles sont transmises par les organes 



2 



des sens qui recoivent des stimuli physiques (vue, ouie, 

toucher) et chimiques (gout, odorat) . Dans la plupart 

des especes, la perception des stimuli chimiques est 

essentielle pour 1 ' accomplissement de plusieurs taches 

vitales comme localiser la nourriture, identifier des 

partenaires, identifier la progeniture et detecter les 

predateurs ou d'autres dangers. Dans certaines especes, 

1' odorat permet aussi la communication, a des distances 

pouvant atteindre plusieurs kilometres, entre individus 

et permettre de rassembler le groupe., les reactions 

d'attaque et de defense, l'activite de reproduction et 

1 ' allaitement . Les molecules odorantes peuvent aussi 

induire des changements physiologiques . 

Dans la plupart des cas les odeurs resultent 

d'une combinaison complexe de plusieurs molecules, Cette 

complexite souleve d' interessantes questions sur les 

caracteristiques des recepteurs pour permettre aux 

animaux de reconnaitre une myriade de molecules 

odorantes (estimees a plus de 10 000) a des 

concentrations aussi basses que 

- 12 

10 M. II semble que la reconnaissance est basee sur 
une large famille multigenique de recepteurs d' odeurs 
comprenant plusieurs centaines ou milliers de sous 
types. Ces recepteurs sont supposes contenir 7 domaines 
trans-membranaires , a partir de l'hypothese selon 
laquelle les signaux odorants sont transduits par des 
cascades de reactions couplees aux proteines G dans les 
neurones olfactifs sensitifs. La transduction resulte en 
une augmentation de seconds messagers comme les 
nucleotides cycliques ou 1' inositol triphosphate et a 
leur tour ces messagers activent les canaux iono- 
dependants et la phosphorylation de plusieurs proteines 
parmi lesquelles les recepteurs d' odeurs eux-memes . 

Buck et Axel (3) ont d'abord caracterise des 
recepteurs d' odeurs de rat a l'aide de techniques 
d ' amplification (PCR) et d 1 amorces degen^rees 



correspondant aux domaines les plus conserves des 
recepteurs couples aux proteines G. Depuis ces premiers 
travaux, plus de 339 recepteurs ont ete sequences, le 
plus souvent partiellement , parmi une grande variete 
d'especes dont l'homme, le chien, la souris, le poulet, 
deux especes de poisson, deux especes d ' amphibiens et un 
nematode. Beaucoup d' especes restent cependant encore a 
etudier et on estime que plus de 1000 genes (soit 1% du 
genome) codent pour la superfamille des recepteurs 
olfactifs. Les mecanismes sous-jacents a la perception 
olfactivee sont singuliers et uniques en comparaison 
avec d'autres systemes sensoriels et une etude plus 
poussee dans ce domaine qui a d' importantes implications 
pour 1 ' identification de ces proteines est necessaire. 

Plusieurs travaux ont souligne 1 ' importance 
de l'olfaction pour la marmotte des Alpes (2). Des 
etudes ethologiques et analytiques ont montre qu 1 un 
groupe de 40 composes, produits par les glandes jugales, 
etait utilises pour marquer le territoire et identifier 
le groupe social. Les travaux realises dans le cadre de 
la presente invention sur l'epithelium olfactif de la 
marmotte des Alpes visaient notamment a obtenir un 
nombre suffisant de sequences de recepteurs olfactifs 
pour permettre une comparaison significative avec les 
sequences de vertebres precedemment determinees. Une 
strategie basee sur la RT-PCR a ete utilis^e pour 
identifier des sequences putatives de recepteurs 
olfactifs de marmotte. Des oligonucleotides degeneres 
correspondant a la sequence des domaines conserves dans 
le second domaine transmembranaire, la seconde boucle 
intracellulaire et le 7eme domaine transmembranaire de 
recepteurs olfactifs ont ete utilises par paires comme 
amorces pour des PCR a partir de 1 * ADN complementaire 
obtenu en utilisant 1 1 ARNm de 1' Epithelium nasal de 
marmotte . 

Les travaux de recherche realises dans le 
cadre de la presente invention ont ainsi permis pour la 
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premiere fois d' identifier , de doner et de sequencer de 
nouveaux recepteurs olfactifs chez la marmotte. Ces 
recepteurs sont utiles pour la conception et la mise au 
point de biocapteurs ou la preparation de cellules 
transf ec tees . Ainsi, ces recepteurs peuvent etre 
associes a des membranes artif icielles qui seront 
utilisees dans differents biocapteurs disposes en 
parallele, chacun possedant un type particulier de 
recepteur, 1' ensemble etant gere par un logiciel de 
reseaux de neurones formels pour constituer un systeme 
de detection de type nez electronique dont les capteurs 
sont des capteurs bioelectroniques . 

L' invention se rapporte done a un recepteur 
olfactif purifie de marmotte. 

La distinction entre des dizaines de 
milliers d'odeurs depend d'une myriade de recepteurs 
situ6s a la surface des dendrites neuronales de 
1* epithelium nasal. En utilisant 1' epithelium nasal de 
la marmottes des Alpes et differents jeux d 1 amorces 
degerierees correspondant a ces sequences consensus de 
recepteurs d'odeurs, les inventeurs sont parvenus a 
amplifier par PCR-inverse (RT-PCR) , doner et obtenir la 
sequence partielle de 23 nouveaux produits de genes 
codant pour des recepteurs d'odeurs. Apr6s consultation 
par le programme blast des banques de donnees du NCBI, 
leur traduction en sequences d'acides amines montre une 
forte similarity avec des sequences proteiques de 
recepteurs d'odeurs precedemment rapportees, et les 
classe sans ambiguite dans la meme superfamille de 
recepteurs a 7 domaines transmembranaires . Les regions 
helicoidales transmembranaires III, IV et V, ainsi que 
les boucles intra et extracellulaires ont ete definies 
par 1 1 etablissement d ' un profil d ' hydropathie et la 
prediction par ordinateur de la structure secondaire. 
Dans une premiere tentative de cartographie des sites de 
fixation d'odeur, les inventeurs ont realise une analyse 



de variability du type de celle decrite par Wu et Kabat 
(8) sur les regions determinant la complementarite (CDR) 
des immunoglobul ines . Quatre pics principaux de 
variability sont localises a 1 1 interieur des lere et 
3eme boucles extracellulaires predites, et a 1* interieur 
des 4eme et Seme domaines transmembranaires predits. Ces 
positions feraient done partie du site specifique de 
liaison des molecules odorantes . Les comparaisons avec 
la sequence de recepteurs olfactifs d'autres especes 
suggerent que les sequences de la marmotte determinees 
dans cette £tude appar tiennnent a trois families 
dif f erentes . 

L' invention concerne done plus 
particulierement un recepteur olfactif purifie constitue 
par ou comprenant la sequence en acides amines choisie 
parmi celles representees dans la liste de sequences en 
annexe sous les numero SEQ ID No:l a SEQ ID No: 23, ou un 
derive f onctionnellement equivalent de celles-ci. On 
entend par derive equivalent de ces sequences, les 
sequences comprenant une modification et/ou une 
suppression et/ou une addition d'un ou plusieurs residus 
d' acides amines mais conservant environ 75% et de 
preference au moins 95% d'homologie avec la sequence 
dont elle est derivee. Les recepteurs de 1' invention 
presente des regions tres conservee et des regions tres 
heterogenes. On considdre que les regions tres 
conservees sont celles conferant a la proteine son 
caractere de recepteur, alors que les regions tres 
heterogenes sont celles qui conferent a chaque recepteur 
sa specif icite. Ainsi, selon 1 ' application envisagee, il 
est possible de preparer des derives des recepteurs de 
1' invention dont la specif icite est modifiee mais qui 
res tent dans le cadre de la presente invention. 

L 1 invention a egalement pour objet les 
anticorps poly ou monoclonaux dirig^s contre au moins un 
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r^i/i«Kyy/ui4y5' 



recepteur de 1* invention, un derive ou un fragment de 
ceux-ci. Ces anticorps peuvent etre prepares par les 
methodes decrites dans la litterature. Les anticorps 
polyclonaux sont formes selon les techniques classiques 
5 par injection des proteines, extraites a partir 

d* epithelium ou produite par transformation genetique 
d ' un hote, a des animaux, puis recuperation des 
antiserums et des anticorps a partir des antiserums par 
exemple par chromatographic d'af finite. Les anticorps 

10 monoclonaux peuvent §tre produits en fusionnant des 

cellules de myelomes avec des cellules de rates 
d'animaux prealablement immunises a 1 • aide des 
recepteurs de 1' invention. Ces anticorps sont utiles' 
pour rechercher de nouveaux recepteurs olfactifs ou les 

15 homologues de ces recepteurs chez d'autres mammi feres ou 

encore pour etudier la parente entre des recepteurs de 
differents individus ou especes. 

L* invention se rapporte egalement a une 

20 molecule d'acide nucleique comprenant ou constitute par 

une sequence nucleique codant pour un recepteur tel que 
dtfini precedemment . Plus particulierement , 1' invention 
se rapporte a une molecule d'acide nucleique comprenant 
ou constitute par une sequence choisie parmi celles 

25 representees dans la liste de sequences en annexe sous 

les numero SEQ ID No: 24 a SEQ ID No: 47, lesquelles 
codent respect ivement pour les recepteurs dont les 
sequences en acides amines sont representees dans la 
liste de sequences en annexe sous les numero SEQ ID No:l 

30 a SEQ ID No: 23. 

L' invention concerne bien entendu aussi les 
sequences nucleot idiques derivees des sequences ci- 
dessus, par exemple du fait de la degenerescence du code 
genetique, et qui code pour des proteines pr6sentant des 

35 caracteristiques et proprietes de recepteurs olfactifs. 



L ' invention concerne egalement un vecteur 
comprenant au moins une molecule d'acide nucleique 
precedente, avantageusement associee a des sequences de 
contr61e adaptes, ainsi qu'un procede de production ou 
5 d' expression dans un bote cellulaire d'un recepteur de 

1" invention ou d'un fragment de celui-ci. La preparation 
de ces vecteurs ainsi que la production ou 1* expression 
dans un bote des proteines de 1' invention peuvent etre 
realisees par les techniques de biologie moleculaire et 
10 de genie genetique bien connues de l'homme du metier. 

A titre d'exemple, un procede de production 
d'un recepteur selon 1' invention consiste : 

a transferer une molecule d'acide 
nucleique de 1' invention ou un vecteur contenant ladite 
15 molecule dans un hote cellulaire, 

- a cultiver ledit hote cellulaire dans des 
conditions permettant la production de la proteine 
const ituant le recepteur, 

- a isoler, par tous moyens appropries les 
20 dites proteines. 

A titre d'exemple, un procede d* expression 
d'un recepteur selon 1' invention consiste : 

a transferer une molecule d'acide 
nucleique de 1 1 invention ou un vecteur contenant ladite 
25 molecule dans un hote cellulaire, 

- a cultiver ledit hote cellulaire dans des 
conditions permettant 1" expression desdites recepteurs a 
la surface de l'hote. 

L'hote cellulaire mis en oeuvre dans les 
30 procedes precedents peut etre choisi parmi les 

procaryotes ou les eucaryotes et notamment parmi les 
bacteries, les levures, les cellules de mammiferes, de 
plantes ou d'insectes. 

L* expression dans des cellules eucaryotes 
35 est preferable pour que les recepteurs puissent subir 
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les modifications post-traductionnel les necessaires a 
leur fonction. 

Une molecule d'acide nucleique codant pour 
un recepteur olfactif ou un vecteur selon 1' invention 
5 peuvent aussi etre utilises pour transfomer des animaux 

et etablir une lignee d' animaux transgeniques . 

Le vecteur utilise est choisi en fonction de 
l'hote dans lequel il sera transfere; il peut s ' agir de 

10 tout vecteur comme un plasmide. 

L' invention concerne done aussi les botes 
cellulaires exprimant des recepteurs olfactifs obtenus 
conf ormement aux procedes precedents . 

L' invention concernent egalement les sondes 

15 nucleiques et oligonucleotides prepares a partir des 

molecules d'acide nucleique de 1' invention. 

Ces sondes, avantageusement marquees, sont 
utiles pour la detection par hybridation de sequences 
similaires de recepteurs chez d'autres individus ou 

20 especes. Selon les techniques classiques, ces sondes 

sont mises en contact avec un echantillon biologique. 
Differentes techniques d 1 hybridation peuvent etre mises 
en oeuvre telles que 1 ' hybridation sur taches (Dot-blot) 
ou 1 ' hybridation sur r^pliques (technique de Southern) 

25 ou autres techniques (DNA chips) . De telles sondes 

constituent des outils permettant de detecter rapidement 
des sequences similaires dans les genes codant pour des 
recepteurs olfactifs ce qui permet d'etudier la 
presence, I'origine et la conservation de ces proteines. 

30 Les oligonucleotides sont utiles pour des 

experiences de PCR par exemple pour rechercher des g£nes 
dans d'autres especes ou dans un but de diagnostic. 

Comme indique precedemment , les recepteurs 
35 olfactifs sont des proteines a 7 domaines 

transmembranaires couplees aux proteines G. La fixation 



d'un ligand sur le recepteur entraine un changement de 
conformation du recepteur, et a 1 ' interieur de la 
cellule, ce signal est transduit par 1 ' intermediaire de 
seconds messagers. En consequence, 1' invention a pour 
objet un procede de criblage de composes susceptibles de 
constituer des ligands des recepteurs decrits 
precedemment consistant a mettre en contact un compose 
et un ou plusieurs desdits recepteurs et a mesurer par 
tout moyen approprie 1 ' af finite entre ledit compose et 
ledit recepteur. 

La mise en contact entre le compose a tester 
et le ou les recepteurs olfactifs de 1' invention peut 
etre realisee en utilisant des h6tes decrits 
precedemment et exprimant a leur surface au moins 
desdits recepteurs. II peut s'agir d'une lignee de 
cellules immortalisees olfactives ou non, transfectee 
par un vecteur portant 1 ' ADNc permettant d'exprimer a sa 
surface et a un niveau eleve un recepteur olfactif 
recombinant fonctionnel. Si le compose teste constitue 
un ligand, sa mise en contact avec des cellules 
transformees , induit des signaux intracellulaires qui 
decoulent de la fixation dudit compose sur le recepteur. 

La mise en contact des composes a tester 
avec les recepteurs de 1' invention peut aussi etre 
realisee en fixant un ou plusieurs recepteurs sur une ou 
plusieurs membranes. Les recepteurs olfactifs de 
1' invention peuvent done aussi etre integr^s a un 
biocapteur. Dans un tel systeme, il est possible de 
visualiser en temps reel des interactions entre le 
compose teste et le recepteur. L'un des partenaires du 
couple recepteur/ligand est fixe sur une interface qui 
peut contenir une matrice recouverte de chaines 
aliphatiques . Cette matrice hydrophobe peut etre 
facilement recouverte d'une couche lipidique par fusion 
spontann^e de liposomes injectes a son contact, Des 
recepteurs olfactifs inseres dans des liposomes ou des 
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vesicules peuvent ainsi etre integres a des biocapceurs . 
Les ligands sont ainsi analyses vis-a-vis d'un ou 
plusieurs recepteurs olfactifs differents. 

Les methodes ci-dessus permettent de 
determiner si un compose active ou inhibe les 
recepteurs. Dans ce mode de realisation, il est 
avantageux de disposer d'un ligand connu qui permet des 
mesures par competition. 

L' invention se rapporte done aussi a un 
compose non encore connu constituant un ligand d 1 un 
recepteur olfactif, identifie et selectionne par le 
procede ci-dessus. 

Les recepteurs de l 1 invention trouvent des 
applications dans des domaines tres varies comme : 

L'industrie agroalimentaire , pour la 
detection d'arSmes, le controle de qualite, 1* analyse 
d' echanti lions . 

- La parfumerie, pour 1* analyse ou la 
comparaison de parfums. 

- L ' environnement , pour la detection de 
substances toxiques, comme des gaz ou le piegeage 
d * odeurs - 

D'autres avantages et carac ter ist iques de 
1* invention apparaitront a la lecture des exemples qui 
suivent concernant 1 1 identification et le clonage des 
receteurs olfactifs de marmotte, et qui se referent aux 
dessins en annexe dans lesquels : 

- La figure 1 represente 1' analyse des 
produits de PCR realisee a partir de deux types d'ADNc 
(R et T) et 3 jeux d'amorces (c-t, 4-1 et 3-2) . Les 
produits de la reaction ont ete analyses par 
electrophorese sur un gel d* agarose 2 %, comme decrit 
ci-apres dans materiel et methode. La taille des 
fragments a 6t6 estimee par comparaison avec un standard 
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de taille connue (cote droit) . Les depots dans les 
pistes marquees d'une asterisque contiennent les 
fragments de la taille attendue. 

- La figure 2 represente l'alignement de 14 
5 des 23 sequences de recepteurs olfactifs putatifs de 

marmotte. 14 sequences differentes (AMOR 1 a AMOR 14) 
ont ete analysees a l'aide du logiciel Clustalw. Les 
regions ombrees indiquent les domaines consensus 
contenant les acides amines presque ( . ) ou totalement 

10 (*) conserves. Les domaines transmembranaires (DII a 

DVII) , les boucles extracellulaires (El a E3) et les 
boucles intracellulaires ( i2 a i3) ont ete delimitees 
apres la determination des domaines hydrophobes. 

La figure 3 represente les profils 

15 d'hydropathie des sequences longues obtenues avec le jeu 

d' amorces c-t (AMOR 1 a AMOR 7) et les sequences courtes 
obtenues avec le jeu d' amorces 3-2 (AMOR 8 a AMOR 14) 
ont ete obtenues comme decrit dans Materiel et Methodes 
Les sequences longues contiennent 6 regions de forte 

20 hydrophobicite (pics) separees par 5 valleees plus 

hydrophiles. Les sequences courtes presentent seulement 
4 regions de forte hydrophobicite et 3 regions 
hydrophiles. Ces graphes sont compatibles avec la 
presence de 6 ou 4 domaines transmembranaires, pour les 

25 sequences longues et courtes respect ivement . Cette 

architecture est confirmee par les predictions d' helices 
transmembranaires du programme PHD . 

La figure 4 represente 1' analyse de la 
variability des 14 nouvelles sequences ininterrompues de 

30 recepteur olfactif de marmotte. Graphe du haut ; 

variability des residus calculee pour l'alignement de la 
figure 2. La localisation des pics (positions les plus 
variables) et la forme globale de la courbe sont 
independantes de la formule utilisee (Wu & Kabat, 

35 complex! te ou nombre de residus pris en compte) . Graphe 

du bas : index moyen d'hydropathie des sequences 
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alignees. Les pics correspondent aux regions hydrophiles 
(boucles) et les vallees aux regions hydrophobes 
(domaines transmembranaires) . Le graphe minimise 
1 'hydrophobicite du fragment 1 a 59 car la moitie des 
sequences manque a ces positions. Alors que la position 
210 illustre la variability habituelle des boucles 
hydrophiles exposees, la position 148 presente la forte 
variability la plus surprenante dans une region 
fortement hydrophobe (helicoidale) de la molecule. 

La figure 5 represente un dendrogramme 
montrant les similarites entre des recepteurs olfactifs 
de differentes especes. Les sequences de recepteurs 
olfactifs d'autres especes proviennnent de la banque de 
donnees NCBI . 11 y a cinq families (notees a gauche). 
Les asterisques indiquent les sequences pour lesquelles 
le pourcentage de similarite entre espece excede 70 %. 
Abreviations : H : homme ; F : poisson ; C : poulet ; N 
: nematode ; B : abeille ; A : amphibiens ; D : chien ; 
M : souris et MM : marmotte. 

I - MATER J EL ET METHQDES. 

1) Preparation des tissus . 

L ' epithelium olfactif a ete preleve sur une 
marmotte sauvage morte. Pendant la dissection, la t§te a 
ete maintenue congelee dans de la carboglace . Les tissus 
ont ete gardes a -80°C jusqu'a leur utilisation. 

2) Isolement de I'ARNm . 

Les tissus cgeles ont ete reduits en 
poussiere en les concassant avec un pilon dans un 
mortier. Le pilon et le mortier etaient refroidis dans 
de la carboglace et tout 1 ' equipemen't etait sterile. 
L'ARNm poly (A) + a ete isole en utilisant le Micro-Fast 
Track Kit (Invitrogen) puis teste avec le DNA DipStick 
Kit (Invitrogen) . 



3 ) Transcription de l'ADNc . 

L'ARNm poly ( A) + a ete transcrit en ADNc & 
l'aide d'une transcriptase inverse puis amplifie par 
PCR. Pour augmenter la production du premier brin d ' ADNc 
complet le kit cDNA Cycle Kit a ete utilise. La 
transcription inverse a ete faite a partir de 150 ng 
d'ARNm poly(A)+ en utilisant des amorces oligo dT ou des 
random primers. Apres extraction avec phenol / H20 / 
EDTA (v/v/v : 1/20/80), l'ADNc de la phase aqueuse a ete 
precipite en presence d' acetate d' ammonium et de 
glycogene entraineur dans de l'ethanol glacial a -80°C, 

4) PCR . 

Trois jeux d 1 oligonucleotides degeneres 
specifiques de recepteurs olfactif sont ete synthetises 
pour amplifier ces recepteurs de marmotte. 

A partir de resultats ant^rieurs obtenus 
chez le rat (3), deux jeux d'amorces ont ete 
synthetisees contre des regions conservees du second et 
du septieme domaine transmembranaire des recepteurs 
olfactif s . 

Amorce 4 : 5'-CC(CT) ATG TA(TC) TTI TT(TC) 
CT (CT) I(GCMCT) AA (TO (TC)TI TC. 

Amorce C : 5'-CC(CT) ATG TA(TC) TTG TT(TC) 
CT(CT) G(GC)(CT) AA(TC) (TC)TG TC- . 

Amorce 1 : 5'-(AG)TT (TC)C(TG) IA (AG) 
(AG) (CG) (AT) (AG)TA I AT (GA)A(AT) IGG (AG) TT, 

Amorce T : 5 ' -GCA CTG CAG AT ( AG ) AAI GG (AG) 
TTI A (AG) ATI GG . 

Ces combinaisons d' amorces ont ete con?ues 
pour permettre d* amplifier des produits de 1 1 ordre de 
720 pb. 

A partir de resultats anterieurs obtenus 
chez le rat (3) et le poisson-cha t , le 3eme jeu 
d' oligonucleotides degeneres a ete synthetise a partir 
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des regions conservees de la 2eme boucle intracellulaire 
et du 7eme domaine transmembranaire . 

Amorce 3 : 5 ' -CAC AAG CTT TIG CIT A(TC)G 
A(CT)A G(AG)T (TA) (TC) (TCG) TIGC. 

Amorce 2 : 5 1 -GCA CTG CAG AT ( AG ) AAI GG(AG) 
TTI A(AG)C ATI GG. 

Ces combinaisons d* amorces ont ete congues 
pour permettre d'amplifier des produits de 1 ' ordre de 
520 pb. 

L ' amplification a ete realisee dans 50 
microlitres d'une solution contenant 5 microlitres 
d'ADNc, 2 mM dNTP , 100 pmol de chaque amorce degeneree, 
1,5 U de polymerase Taq (Boehringer Mannheim, 
Allemagne) , 50 mM KC1, 2,5 mM MgC12, 10 mM Tris/HCl 
pH8,3 et 0,01 de gelatine. Pour eviter 1 ' evaporation, la 
surface du melange a ete couverte par 35 microlitres 
d'huile minerale (Sigma, France) . La PCR a ete realisee 
a l'aide d'un thermocycler (Hybaid, Omnigene, USA) selon 
le protocole suivant : un cycle a 94°C pendant 90 s, 40 
cycles a 94°C pendant 20 s, 50°C pendant 25 s et 72°C 
pendant 90 s, et un cycle a 72°C pendant 120 s. 

Apres la PCR, 5 microlitres du produit de la 
reaction ont ete analyses sur gel d' agarose Seaplaque 
2%, pour verifier que la presence du fragment (Tebu) . 
S*il etait present, les 45 microlitres restant ont ete 
sounds a electrophorese et l'ADNc a £te extrait du gel 
d'agarose a 1 ' aide du kit QIARX II (Qiagen) . L'ADNc 
extrait a ete insere dans le vecteur pMOSBlue qui a ete 
utilise pour infecter les cellules de E.coli MOSBlue 
competentes en utilisant le kit pMOSBlue T-vector selon 
le protocole du fournisseur (Amersham) . Les bacteries 
infectees ont ensuite ete cultivees sur un milieu 
selectif (Xgal/IPTG) . 

Les clones recombinants ont ete testes par 
PCR directe sur colonie. En bref , chaque colonie blanche 
a £te resuspendue dans 10 microlitres de tampon TE. La 



PCR a ete realisee dans 10 microlitres d'une solution 
contenant 1 microlitres de suspension de colonie, 3 
pmoles de chaque amorce universelle U19 et T7 , 10 mM 
dNTP, 50 mM KC1 et 2,5 mM MgC12 dans un tampon Tris HC1 
pH 8,3 avec 0,25 U de polymerase Taq. Le protocole pour 
la PCR etait le suivant : un cycle a 94°C pendant 270 s, 
30 cycles a 94°C pendant 30 s, 48°C pendant 30 s et 72°C 
pendant 50 s, et un cycle a 72°C pendant 120 s. Apres la 
PCR, 10 microlitres du produit de la reaction ont ete 
analyses sur un gel a 2% d' agarose. Les clones positifs 
ont ete cultives en milieu L3 liquide contenant 0,1 mg / 
ml d' ampicilline . 

5) Extraction et purification des fragments 

d ; ADNc . 

L'ADNc plasmidique a ete extrait et purifie 
en utilisant le kit Wizard miniprep (Proinega) . Les 
echantillons ont ete sequences par Genome Express 
(Grenoble, France) . 

6 ) Analyse des sequences . 

La comparaison des sequences de recepteur 
olfactif de marmotte de 1' invention avec d'autres 
sequences disponibles dans GenBank / GenPept a ete 
realisee en utilisant le programme Blast sur le serveur 
NCBI. ClustalW a ete utilise pour construire les 
alignements multiples et realiser 1' analyse 
phylogene tique . Les domaines hydrophobes ont ete 
delimites en utilisant un simple profil d * hydropathie, 
et la prediction des domaines transmembranaires a- 

helicoidaux en utilisant le serveur PHD. Enfin, la 
variability des 14 sequences de marmotte alignees, ainsi 
que leur hydropathie ntoyenne, ont ete determinees et 
traduites sous forme graphique a l'aide du programme 
Rav3 . Les domaines transmembranaires ont ete predits 
avec le logiciel Top Pred II. 
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II ~ RSSULTATS . 

1) Isolement de 1 1 ARNm . 

Un echantillon d 1 approximat ivement 2 g, 
contenant principalement de 1 ' epithel ium olfactif et le 
cartilage le supportant a ete retire de la tete congelee 
d'une marmotte. Cet echantillon a ete utilise pour la 
purification et les tests d ' ARNm selon la description de 
la section Materiel et Methodes . Au total, 1,95 
microgramme d ' ARNm ont ete obtenus . Pour augmenter les 
chances de doner des recepteurs olfactifs, la moitie de 
1 ' ARNm obtenu a ete transcrit en presence de 1' amorce 
oligo d(T) et 1' autre moitie en presence de 1 ' amorce 
random (R) . 

2 ) Amplification des sequences de recepteurs 

olfactifs . 

L * amplification par PCR a ete realisee avec 
150 ng d ' ARNm en utilisant les trois jeux d' amorces 
specifiques degenerees (c-t, 4-1, 3-2) decrites 
precedemment dans Materiel et Methodes. L' analyse de 
1 ■ electrophorese realisee avec des aliquotes de 5 
microlitres des produits de la PCR a revele des bandes 
uniques de la taille attendue (Fig.l). Avec l'ADNc "T" , 
une bande 520 pb a ete obtenue avec les amorces 3-2 et 
une bande de 720 pb avec les amorces c-t. Avec l'ADNc 
"R", une bande de 720 pb a ete obtenue en utilisant les 
amorces c-t. Aucune bande n'a ete observee dans les 
trois autres pistes. Dans les PCR de controle, dans 
lesquelles une seule amorce etait utilisee, aucune bande 
de la longueur attendue n'a 6te observee. 
L ' 61ectrophorese a et6 repetee en utilisant les 45 
microlitres restant de 1 • echantillon , et les fragments 
de 550 et 720 pb ont ete extraits. Etant donnee la 
diversite des recepteurs olfactifs, il a 6te suppose que 



la population d'ADNcdans une bande etait heterogene et 
il n'a done pas ete essaye de sequencer directement les 
fragments d ' ADNc amplifies par PCR. Ces fragments ont 
ete clones dans E. coli comme decrit precedemment . 

3) Clonaqe . 

Apres insertion dans le vecteur p-Mosblue et 
1' infection de E. coli MOSBlue competentes, 139 clones 
bacteriens ont ete obtenus au total, dont 58 a partir de 
la PCR realisee a partir de I'ADNc "R" et les amorces c- 
t (clones R c-t), 31 a partir de la PCR realisee a 
partir de 1 1 ADNc "T" et les amorces c-t (clones T c-t) 
et 50 a partir de la PCR realisee a partir de I'ADNc " T " 
et les amorces 3-2 (clones T 3-2) . Pour confirmer la 
presence du fragment attendu, nous avons realise une 
autre PCR sur chacun des 139 clones en utilisant des 
amorces correspondant aux zones du vecteur situees sur 
chaque c6te du fragment. L ' elec trophor£se sur gel 
d' agarose des produits de la PCR a montre que 5 clones R 
c-t, 10 clones T c-t et 22 clones T 3-2 possedaient des 
fragments de la taille attendue. Ces 37 clones positifs 
ont ete cultives a nouveau pour une production de masse. 

4 ) • Sequengaqe . 

L'ADN plamsidique a ete extrait, purifie et 
sequence comme decrit precedemment. Les sequences 
nucleotidiques ont ete comparees avec celles trouvees 
dans les banques de donnees . Sur les 28 sequences 
pr^sentant des scores eleves de similarite avec les 
rkepteurs olfactifs, 14 etaient differentes et 
ininterrompues (AMOR 1 a 14) et pouvaient coder pour des 
recepteurs olfactifs. Les autres 14 sequences etaient 
identiques (n=8) , inutilisables (n=3) ou incompletes 
pour nos conditions experimentales (116, 153, 159 acides 
amines) . Les 14 sequences utilisables avaient un seul 
cadre ouvert de lecture permettant leur traduction en 



acides amines. L* attribution de la sequence de lecture 
correcte a ete confirmee par la similarite de ces 
traductions putatives avec les sequences en acides 
amines d'autres recepteurs olfactifs disponibles dans 
Gen Bank / GenPept. Le pourcentage de residus identiques 
dans les meilleurs alignements s'etendait entre 84% 
(entre AM0R4 et une sequence partielle de Xenopus laevis 
No d' accession #: 1617233) et 46 % (entre AMOR 5 et la 
sequence de Rattus norvegicus No d ' accession** : 1016362) . 
7 des 14 sequences de marmotte presentaient le meilleur 
alignement avec diff^rents recepteurs de rat, 3 avec le 
meme recepteur humain (accession : #AC002988), 3 avec la 
meme sequence de chien (accession #:X89660) et un avec 
la sequence de Xenope citee precedemment . Le pourcentage 
moyen de residus identiques etait 64%. Sept (AMOR 1-7) 
des nouvelles sequences de marmotte ont ete amplifiees a 
partir d'un couple d' amorces congu & partir des domaines 
transmembranaires II et VII et sont longs de 2 34 a 237 
residus. Sept autres sequences (AMOR 8-14) ont ete 
obtenues avec les amorces congues a partir de la boucle 
intracellulaire 2 (i2) et le domaine transmembranaire 
VII et contiennent 176 residus. Le pourcentage de 
residus identiques entre ces 14 nouvelles sequences est 
compris entre 33 % (AMOR 4 / AMOR 8) et 79 % (AMOR 8 / 
AMOR 11) . 

5) Structure du domaine du recepteur 
olfactif putatif de marmotte . 

L'homologie globale entre les 14 nouvelles 
sequences de marmotte et les sequences de recepteurs 
precedemment identifiees laisse peu de doutes quant h 
leur appartenance a la meme superfamille des recepteurs 
a 7 domaines transmembranaires. Selon la localisation 
des amorces utilis6es pour les amplifier, les sequences 
partielles AMOR 1-7 et AMOR 8-14 devraient presenter 6 
ou 4 domaines transmembranaires respect ivement . La 



Figure en annexe 3 montre que le profil d'hydrophobicite 
de ces sequences est compatible avec une telle 
organisation. Afin de delimiter plus precisement les 
regions transmembranaires a-helicoidales , 1 * alignement 
de la Figure 2 a aussi ete soumise au serveur PHD. 5 
regions transmembranaires ont ete assignees sans 
ambiguite dans les regions respectives (38-62), (86- 
103), (140-164), (186-203) et (216-232), qui 
correspondent aux domaines Dili, DIV, DV, DVI et DVII 
dans la figure 2. 

Les inventeurs ont 6galement chercher a 
situer les positions impliquees dans le site de fixation 
specif ique de l'odeur en appliquant une analyse 
precedemment introduite pour les molecules qui lient les 
antigenes. Ici, le raisonnement est que si ces 
recepteurs olfactifs sont supposes lier specif iquement 
des molecules odorantes, les r§sidus qui constituent le 
site spdcifique de liaison pourraient montrer plus de 
variabilite que ceux qui sont impliques dans la 
structure core et dans la fonction de signalement. 

La Figure 4 montre les profils de 
variabilite obtenus avec 1 1 alignement de la Figure 2. 
Quatre pics de variabilite sont clairement visibles. Le 
profil moyen d ' hydropathie (average hydropathy plot) 
montre en parallele (Figures 2 et 4) indique qu'ils ne 
sont pas uniquement situ6s h 1 ' interieur de boucles 
hydrophiles comme escompte (position 210), mais aussi 
dans des regions hydrophobes (e.g. position 148). Le 
centre des segments les plus variables est situe aux 
positions 30, 100, 148 et 210, la cartographie 
respectivement a 1* interieur de la lere boucle 
extracytoplasmique El, les 4eme et Seme regions 
transmembranaires DIV et DV, et le milieu de la 3 erne 
boucle extracytoplasmique E3 . Nous proposons que les 
residus a ces positions pourraient §tre impliques dans 
le site de liaison de molecules odorantes inconnues 
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correspondant a ces recepteurs . Ces positions sont 
compatibles avec l'hypothese selon laquelle les regions 
transmembranaires pourraient s' assembler en un calice 
ouvert vers l'exterieur pouvant recevoir une molecule 
odorante. Un tel modele est aussi en accord avec le fait 
que beaucoup de molecules odorantes presentent un 
caractere hydrophobe. 

6) Classification structurale des recepteurs 

plfactifs. 

Nous avons tente de classer les recepteurs 
clones de marmotte par rapport aux sequences 
pr^cedemment decrites pour d'autres especes. La Figure 5 
montre une classification structurale de 122 recepteurs 
olfactifs de la banque de donnees EMBL trouves dans 
diff6rentes especes ainsi que les 14 sequences completes 
et les 3 sequences incompletes identifiees chez la 
marmotte dans le cadre de la pr<§sente invention. A 
l'exeption des recepteurs de poisson, les recepteurs ne 
sont pas regroupes par especes. 11 y a 5 families 
contenant un nombre varie de recepteurs. Les recepteurs 
olfactifs de marmotte ont ete classes en sous- families 
1, 2 et 5 . 12 sequences ont ete rangees dans la sous 
famille 2. 

Le plus fort pourcentage d' homologies 
interespeces (plus de 70 % de residus identiques) entre 
recepteurs olfactifs a ete observe dans 9 cas indiques 
par une aster isque : entre le rat et la souris (jusqu'a 
95 %) dans 5 cas, entre le rat et l'homme (80 %) dans un 
cas, entre le chien et l'homme (jusqu'a 85 %) dans deux 
cas, et entre le recepteur de marmotte et celui de rat 
dans un cas (73 %) . L'homologie entre les recepteurs 
humains et de marmotte ne depasse jamais 75 % de residus 
identiques . 
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Les recepteurs olfactifs comprennent une 
large famille mul tigenique . Leur etude demande une 
combinaison d'approches; Une strategie de PCR inverse 
avec plusieurs amorces differentes a ete mise en oeuvre 
dans le cadre de la presente invention. Cette approche a 
ete couronnee de succes puisque 2 8 sequences putatives 
de recepteurs olfactifs dont 14 pouvaient permettre une 
analyse comparative ont ete obtenues. II est possible 
d'obtenir plus de sequences en changeant simplement les 
conditions de PCR. La famille de genes clones dans le 
cadre de la presente invention code pour des recepteurs 
olfactifs pour deux raisons. D'une part les profils 
d • hydropathie des sequences sont en accord avec les 
recepteurs de la superfamille des recepteurs a sept 
domaines transmembranaires . D' autre part, la comparaison 
avec les sequences de banques de donnees montre un fort 
degre de similarite avec les recepteurs olfactifs 
precedemment identifies . 

Les sites potentiels de reconnaissance des 
ligands sur les recepteurs olfactifs putatifs de 
marmotte ont 6te identifies. Comme 1' olfaction requiert 
la reconnaissance specif ique d'une grande variete de 
molecules odorantes, il a ete postule que le site de 
liaison du recepteur olfactif avec son ligand 
presenterait une plus grande variability entre residus 
que les autres parties de la sequence responsables de la 
structure core et de la fonction de transduction. Il a 
ete observe la plus forte variability a l'int6rieur de 
deux domaines transmembranaires (DIV et DV) et a 
l'interieur de deux boucles extracellulaires (El et E3). 
II a done ete conclu que ces regions pourraient etre 
impliquees dans la reconnaissance du ligand. 

La presence d'un site de liaison profond 
dans le calice transmembranaire n'est pas un caractere 
specifique des recepteurs olfactifs recepteur mais est 
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commun parmi les recepteurs a 7 domaines 
transmembranaires des amines biog^nes . 

Le site principal d ' interaction entre les 
recepteurs a 7 domaines transmembranaires et la proteine 
5 G apparentee est la troisieme boucle intracellulaire . 

Pour les sequences presentees ici, le segment le plus 
conserve est situe entre les positions 180 a 193, c'est 
a dire la fin de cette boucle et le debut du 6eme 
domaine transmembranaire. 
10 Les resultats obtenus indique une analogie 

remarquable entre le recepteur olfactif de marmotte et 
le recepteur olfactif de rat. La longueur (18 residus) 
de la 3eme boucle intracellulaire (i3) etait courte. La 
sequence consensus IVSSI (ou une sequence proche) etait 
15 a l'extremite N-terminale de la 3eme boucle 

intracellulaire dans 75 % des clones de 1' invention. La 
troisieme boucle intracellaire est riche en residus 
Serine et peut done constituer des sites de 
phosphorylation pour GRK . Les recepteurs a 7 domaines 
20 transmembranaires sont classes en plusieurs groupes . Les 

recepteurs olfactifs sont supposes appartenir au groupe 
I, qui est caracterise par la presence d'une sequence 
DRY strictement conservee du c6te N-terminal de i2 . La 
sequence DRY est presente dans 4 des clones de 
25 1' invention mais est remplacee par une sequence DRF dans 

les 10 restant. 

La reconnaissance des m§mes odeurs par des 
especes differentes souleve une interessante question. 
On peut s'attendre a ce que ces especes aient des 
30 recepteurs orthologues . En utilisant le logiciel 

clustalW (figure 5), les inventeurs ont chercher a 
determiner si certains des recepteurs olfactifs de 
marmotte etaient bonafide orthologues de recepteurs 
olfactifs d'autres especes, en particulier d'autres 
35 rongeurs. Pour les recepteurs couples aux pro twines G, 

les pourcentages d'identite entre les recepteurs 



orthologues de differentes especes allaient de 68 % 
(pour le recepteur CSN entre le chien et l'homme) a 98 % 
(pour le recepteur cannabinoide du rat et de l'homme). 
Des recepteurs olfactifs avec des pourcentages de 
similitude de cet ordre ont ete observes entre rat et 
souris, rat et homme, et chien et honune, Un seul 
recepteur olfactif de marmotte presentait un pourcentage 
de similitude de cet ordre avec un recepteur de rat 
(AMOR14 73%) - En general, nous avons trouve peu 
d' homologies fortes. Cette decouverte pourrait indiquer 
que, soit le nombre de recepteurs olfactifs etait trop 
petit pour permettre 1 1 identification de vrais 
recepteurs orthologues, soit le pourcentage de 
similarite entre recepteurs olfactifs orthologues peut 
devenir inferieur a 68 %. 

Une autre alternative serait que les animaux 
sauvages expriment de recepteurs pour davantage d'odeurs 
que les animaux de laboratoire. La marmotte des Alpes 
(Marmota marmota) a ete choisie comme modele dans cette 
etude a partir de l'hypothese selon laquelle, etant 
donnee 1 1 importance de 1* olfaction pour survivre dans la 
nature, 1* olfaction serait fortement developpee. La 
marmotte des Alpes marque son territoire avec des 
secretions produites par les glandes jugales. De plus, 
pour cet animal, le sens olfactif est de la plus grande 
importance parce que cette espece possede un fort niveau 
de sociabilite : il vit dans des groupes familiaux 
formes par une paire d'adultes residents reproductifs et 
leur progeniture de plusieurs portees successives qui 
restent dans le groupe natal jusqu'a l'age de 2 ans ou 
plus. Chaque marmotte a une combinaison differente de 
molecules odorantes que les membres du meme groupe ou 
d'un groupe different peuvent flairer. 

Contrairemen t a d'autres systemes 
sensoriels, le systeme olfactif requiert une myriade de 
recepteurs differents. Comme les mammif&res sont 
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generalement supposes avoir environ un millier de genes, 
les clones identifies dans cette 6tude representent 
probablement seulement une partie de la f ami lie des 
recepteurs olfactifs de marmotte. En plus de la 
contribution au nombre de recepteurs identifies, nos 
resultats supportent aussi I'existene de recepteurs 
orthologues entre especes et la notion selon laquelle la 
variability locale observee dans certains des domaines 
transmembranaires pourrait etre capitales pour la 
specif icite d'un recepteur. Conunent m§me un millier de 
recepteurs pourrait etre capable de distinguer parmi la 
dizaine de milliers d'odeurs trouvees dans la nature 
n'est pas encore clair. La confirmation finale de la 
nature et de la specificite olfactive de ces recepteurs 
ne sera pas possible tant que la sequence entiere n'a 
pas ete obtenue et la liaison specifique avec une ou 
plusieurs molecules odorantes demontree. 
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REVENDICATIONS 

1) Un recepteur olfactif purifie de 

marmotte. 

2) Un recepteur olfactif constitue par ou 
comprenant une sequence en acides amines choisie parmi 
celles representees dans la liste de sequences en annexe 
sous les numero SEQ ID No:l a SEQ ID No: 23, ou un derive 
fonctionnellement equivalent de celles -ci. 

3) Un recepteur selon la revendication 2 
constitue par ou comprenant une sequence en acides 
amines presentant environ 75% et de preference au mo ins 
95% d'homologie avec une sequence en acides amines 
choisie parmi celles representees dans la liste de 
sequences en annexe sous les numero SEQ ID No:l a SEQ ID 
No: 23 . 

4) Un recepteur selon l'une des 
revendications 2 ou 3 , constitue par ou comprenant une 
sequence en acides amines choisie parmi celles 
representees dans la liste de sequences en annexe sous 
les numero SEQ ID No:l a SEQ ID No: 23 dont une ou 
plusieurs des regions tres h^terogenes est modifiee. 

5) Un anticorps poly ou monoclonal dirige 
contre au moins un recepteur selon l'une quelconque des 
revendications 1 a 4 ou un derive ou un fragment de 
ceux-ci. 

6) Une molecule d'acide nucleique comprenant 
ou constitute par une sequence nucleique codant pour un 
recepteur selon l'une quelconque des revendications 1 a 
4. 
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7) Une molecule d'acide nucleique selon la 
revendication 6, comprenant ou constitute par une 
sequence choisie parmi celles representees dans la liste 
de sequences en annexe sous les numero SEQ ID No: 24 a 
SEQ ID NO: 47. 

8) Un vecteur comprenant au moins une 
molecule d'acide nucleique selon l'une des 
revendications 6 ou 7 , avantageusement associee a des 
sequences de contrdle. 

9) Procede de production d'un recepteur 
selon l'une quelconque des revendications 1 a 4, 
caracterise en ce qu'il consiste : 

a transferer une molecule d'acide 
nucleique selon l'une des revendications 6 ou 7 ou un 
vecteur selon la revendication 8 dans un hote, 

- a cultiver ledit hote cellulaire dans des 
conditions permettant la production de la prottine 
constituant le recepteur, 

- a isoler, par tous moyens appropries les 
dites proteines. 

10) Proc6de d' expression d'un recepteur 
selon l'une quelconque des revendications 1 a 4 chez un 
hote, caracterise en ce qu'il consiste : 

a transferer une molecule d'acide 
nucleique selon l'une des revendications 6 ou 7 ou un 
vecteur selon la revendication 8 dans un h6te, 

- a cultiver ledit hote dans des conditions 
permettant 1* expression desdites recepteurs a la surface 
de l'hote. 

11) Un hote transforme par une molecule 
d'acide nucleique selon l'une des revendications 6 ou 7 
ou par un vecteur selon la revendication 8. 
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12) Procede de criblage de composes 
susceptibles de constituer des ligands d'un recepteur 
selon l'une quelconque des revendications 1 a 4, 
caracterise en ce gu'il consiste a mettre en contact un 
compose et un ou plusieurs desdits recepteurs puis a 
mesurer par tout moyen approprie l'af finite entre ledit 
compose et ledit recepteur. 

13) Une membrane sur laquelle est fixee un 
ou plusieurs recepteurs selon l'une quelconque des 
revendications 1 a 4 utile pour la mise en oeuvre d'un 
procede selon la revendication 12 . 

14) Un compose constituant un ligand d'un 
recepteur olfactif, identifie et selectionne par le 
procede selon la revendication 13 . 

15) Utilisation d'un recepteur selon l'une 
quelconque des revendications 1 a 4, d'un h6te selon la 
revendication 11 ou d'une membrane selon la 
revendication 13, pour la detection d'aromes, le 
controle de qualite, l'analyse d 1 echanti lions, 1 'analyse 
ou la comparaison de parfums, la detection de substances 
toxiques, ou le piegeage d'odeurs. 
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Fig. 2 
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Fig. 3 
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Fig. 5 
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LISTE DE SEQUENCES 



(1) INFORMATION GENERALES : 

(iii) NOMBRE DE SEQUENCES : 46 

(2) INFORMATION POUR LA SEQ ID NO : 1 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 237 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMORl 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 1 : 

Pro Met Tyr Leu Phe Leu Gly Asn Leu Ser Phe Leu Asp Leu Ser Phe 
15 10 15 

Thr Thr Ser Ser He Pro Gin Leu Leu His Asn Leu Ser Gly Arg Asp 
20 25 30 

Lys Thr He Ser Tyr Val Gly Cys Val Val Gin Leu Phe Leu Phe Leu 
35 40 45 

Gly Leu Gly Gly Val Glu Cys Leu Leu Leu Ala Val Met Ala Tyr Asp 
50 55 60 

Arg Phe Val Ala Val Cys Lys Pro Leu His Tyr Thr Val He Met Ser 
65 70 75 80 

Ser Arg Leu Cys Leu Gly Leu Val Ser Val Ala Trp Gly Cys Gly Met 
85 90 95 

Ala Asn Ser Leu Val Met Ser Pro Val Thr Leu Gin Leu Pro Arg Cys 
100 105 110 

Gly His Asn Lys Val Asp His Phe Leu Cys Glu Met Pro Ala Leu He 
115 120 125 

Arg Met Ala Cys Val Asn Thr Val Ala He Glu Gly Thr Val Phe Val 
130 135 140 

Leu Ala Val Gly He Val Leu Ser Pro Leu Val Phe He Leu Val Ser 
145 150 155 160 

Tyr Gly His He Val Arg Ala Val Phe Arg He Gin Ser Ser Ser Gly 
165 170 175 

Arg His Arg He Phe Asn Thr Cys Gly Ser His Leu Thr Val Val Ser 
180 185 190 

Leu Phe Tyr Gly Asn He He Tyr Met Tyr Met Gin Pro Gly Ser Arg 
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195 



200 



205 



Ser Ser Gin Asp Gin Gly Lys Phe Leu Thr Leu Phe Tyr Asn lie Val 

210 215 220 

Thr Pro Leu .Leu Asn Pro Phe He Tyr Ser Leu Arg Asn 
225 230 235 237 



(3) INFORMATION POUR LA SEQ ID NO: 2 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 237 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR2 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2 : 

Pro Met Tyr Leu Phe Leu Gly Asn Leu Ser Fhe Val Glu Val Cys Leu 
15 10 15 

Thr Ser Thr Thr Val Pro Lys lie Leu Val Asn Thr Gin Thr Leu Ser 
20 25 30 

Lys Asp He Ser Tyr Arg Gly Cys Leu Thr Gin Val Tyr Phe Leu Met 
35 40 45 

val Phe Ala Gly Met Asp Asn Phe Leu Leu Thr Val Met Ala Phe Asp 
50 55 60 

Arg Phe Val Ala He Cys Tyr Pro Leu Asn Tyr Thr Val He Met Asn 
65 70 75 80 

Pro Arg Leu Cys Val Leu Leu Val Leu Leu Ser Trp Leu He Met Phe 
85 90 95 

Trp Val Ser Leu Leu His He Leu Leu Leu Lys Arg Leu Thr Phe Ser 
100 105 110 

Ser Gly Thr Ala Val Pro His Phe Phe Cys Glu Leu Ser Gin Leu Leu 
115 120 125 

Lys Ala Thr Ser Ser Asp Thr Leu Val Asn He He Leu Leu Tyr Val 
130 135 140 

Val Thr Ala Leu Leu Gly He Phe Pro Ala Thr Gly He Leu Tyr Ser 
145 150 155 160 

Tyr Ser Gin He Val Ser Ser Leu Leu Arg Met Ser Ser Ser Val Gly 
165 170 175 

Lys Ser Lys Ala Phe Ser Thr Cys Gly Ser His Leu Cys Val Val Ser 
180 185 190 

Leu Phe Tyr Gly Thr Gly Leu Gly Val His Leu Ser Ser Ala Met Asn 
195 200 205 
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His Pro Ser Gin Gly Asn Met He Ala Ser Val Met Leu His Cys Gly 
210 215 220 



His Pro Met . Leu Asn Pro He He Tyr Thr Leu Arg Asn 
225 230 235 237 



(4) INFORMATION POUR LA SEQ ID NO : 3 : 

(i) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 237 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix) CARACTERI STIQUES 

(A) NOM/CLE: AMOR 3 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3 

Pro Met Tyr Leu Phe Leu Gly Asn Leu Ser Phe Leu Glu Val Trp Tyr 
15 10 15 

Thr Thr Ala Ala Val Pro Lys Ala Leu Ala He Leu Leu Gly Arg Ser 
20 25 30 

Gin Ser He Ser Phe He Ser Cys Leu Leu Gin Met Tyr Leu Val Phe 
35 40 45 

Ser Leu Gly Cys Thr Glu Tyr Phe Leu Leu Val Ala Met Ala Tyr Asp 
50 55 60 

Arg Tyr Val Ala He Cys Phe Pro Leu His Tyr Thr Thr He Met Ser 
65 70 75 80 

Leu Lys Leu Cys Leu Ser Leu Val Val Leu Ser Trp Val Leu Thr Met 
85 90 95 

Leu His Ala Leu Leu His Thr Leu Leu Val Val Arg Leu Ser Phe Cys 
100 105 110 

Ser Asp Asn Val He Pro His Phe Ser Cys Glu He Ser Ala Leu Leu 
115 120 125 

Lys Leu Ala Cys Ser Asn Thr His Val Asn Glu Leu Val He Phe He 
130 135 140 

Thr Gly Gly Leu Val He Val Thr Pro Phe Leu Leu He Leu Gly Ser 
145 150 155 160 

Tyr Val Gin He Phe Ser Ser He Leu Lys Val Pro Ser Ala Arg Gly 
165 170 175 

lie His Lys Ala Phe Ser Thr Cys Gly Ser His Leu Ser Val Val Ser 
180 185 190 

Leu Phe Tyr Gly Thr He He Gly Leu Tyr Leu Cys Pro Ser Ala Asn 
195 200 205 
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Asn Ser Thr Val Lys Asp Thr Val Val Ala Leu Met Tyr Thr Val Val 
210 215 220 



Thr Pro Met Leu Asn Pro Phe lie Tyr Thr Leu Arg Asn 
225 230 235 237 



(5) INFORMATION POUR LA SEQ ID NO: 4 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 34 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 4 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4 

Pro Met Tyr Leu Phe Leu Gly Asn Leu Ser Phe lie Asp Val Cys His 
15 10 15 

Ser Thr Val Thr Val Pro Lys Met Leu Arg Asp Thr Trp Ser Glu Glu 
20 25 30 

Lys Leu lie Ser Phe Asp Ala Cys Val Thr Gin Met Phe Phe Leu His 
35 40 45 

Leu Phe Ala Cys Thr Glu lie Phe Leu Leu Thr Val Met Ala Tyr Asp 
50 55 60 

Arg Tyr Val Ala lie Cys Lys Pro Leu Gin Tyr Met Thr Val Met Asn 
65 70 75 80 

Trp Lys Val Cys Val Leu Leu Ala Val Ala Leu Trp Ala Gly Gly Thr 
85 90 95 

lie His Ser He Ser Leu Thr Ser Leu Thr lie Lys Leu Pro Tyr Cys 
100 105 110 

Gly Pro Asp Glu He Asp Asn Phe Phe Cys Asp Val Pro Gin Val He 
115 120 125 

Lys Leu Ala Cys Thr Asp Thr His He lie Glu He Leu He Val Ser 
130 135 140 

Asn Ser Gly Leu He Ser Val Val Cys Phe Val Val Leu Val Val Ser 
145 150 155 160 

Tyr Ala Val He Leu Val Ser Leu Arg Gin Gin He Ser Glu Gly Arg 
165 170 175 

Arg Lys Ala Leu Ser Thr Cys Ala Ala His Leu Thr Val Val Thr Leu 
180 185 190 

Phe Leu Gly His Cys He Phe He Tyr Ser Arg Pro Ser Thr Ser Leu 
195 200 205 
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Pro Glu Asp Lys Val Val Ser Val Phe Phe Thr Ala Val Thr Pro Leu 
210 215 220 



Leu Asn Pro .Phe lie Tyr Ser Leu Arg Asn 
225 230 234 



(6) INFORMATION POUR LA SEQ ID NO; 5 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 237 

(B) TYPE: . acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix ) C ARACTERI STIQUES 

(A) NOM/CLE: AMOR5 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5 

Pro Met Tyr Leu Phe Leu Gly Asn Leu Ser Leu Leu Glu lie Gly Tyr 
15 10 15 

Thr Cys Ser Val lie Pro Lys Met Leu Gin Ser Leu Val Ser Glu Ala 
20 25 30 

Arg Gly lie Ser Arg Glu Gly Cys Ala Thr Gin Met Phe Phe Phe Thr 
35 40 45 

Leu Phe Ala lie Ser Glu Cys Cys Leu Leu Ala Ala Met Ala Phe Asp 
50 55 60 

Arg Tyr Met Ala He Cys Ser Pro Leu His Tyr Ala Thr Arg Met Ser 
65 70 75 80 

Arg Gly Val Cys Ala His Leu Ala Val Val Ser Trp Thr Val Gly Cys 
85 90 95 

Met Val Gly Leu Gly Gin Thr Asn Tyr He Phe Ser Leu Asp Phe Cys 
100 105 110 

Gly Pro Cys Glu He Asp His Phe Phe Cys Asp Leu Pro Pro He Leu 
115 120 125 

Ala Leu Ala Cys Gly Asp Thr Ser His Asn Glu Ala Ala Val Phe Val 
130 135 140 

Val Ala He Leu Cys He Ser Ser Pro Phe Leu Leu He Val Ala Ser 
145 150 155 160 

Tyr Gly Arg He Leu Ala Ala Val Leu Val Met Pro Ser Pro Glu Gly 
165 170 175 

Arg Arg Lys Ala Leu Ser Thr Cys Ser Ser His Leu Leu Val Val Thr 
180 185 190 

Leu Phe Tyr Gly Ser Gly Ser Val Thr Tyr Leu Arg Pro Lys Ala Ser 
195 200 205 
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His Ser Pro Gly Met Asp Lys Leu Leu Ala Leu Phe Tyr Thr Val Val 

210 215 220 

Thr Ser Mec .Leu Asn Pro lie lie Tyr Thr Leu Arg Asn 

225 230 235 237 



(7) INFORMATION POUR LA SEQ ID NO : 6 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 236 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMORS 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6 

Pro Met Tyr Leu Phe Leu Gly Asn Leu Ser Phe Leu Glu lie Leu Tyr 
15 10 15 

Thr Ser Thr Val Val Pro Lys Met Leu Glu Gly Phe Leu Gin Val Ala 
20 25 30 

Ala lie Ser Val Thr Gly Cys Leu Thr Gin Phe Phe He Phe Gly Ser 
35 40 45 

Leu Ala Thr Ala Glu Cys Phe Leu Leu Ala Val Met Ala Tyr Asp Arg 
50 55 60 

Phe Leu Ala He Cys Tyr Pro Leu Arg Tyr Pro Leu Leu Met Gly Pro 
65 70 75 80 

Arg Trp Cys Met Gly Leu Val Val Thr Ala Trp Leu Ser Gly Phe Met 
85 90 95 

Val Asp Glu Leu Val Val Val Leu Met Ala Gin Leu Arg Phe Cys Gly 
100 105 110 

Ser Asn Arg He Asp His Phe Tyr Cys Asp Phe Met Pro Leu Val Val 
115 120 125 

Leu Ala Cys Ser Asp Pro Arg Val Ala Gin Val Thr Thr Phe Val Leu 
130 135 140 

Ser Val Val Phe Leu Thr Val Pro Phe Gly Leu He Leu Thr Ser Tyr 
145 150 155 160 

Ala Arg He Val Val Thr V&l Leu Arg Val Pro Ala Gly Ala Ser Arg 
165 170 175 

Arg Lys Ala Phe Ser Thr Cys Ser Ser His Leu Ala Val Val Ser Thr 
180 185 190 

Phe Tyr Gly Thr Leu Met Val Leu Tyr He Val Pro Ser Ala Val His 
195 200 205 
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Ser Gin Leu Leu Ser Lys Val Phe Ala Leu Leu Tyr Thr Val Val Thr 
210 215 220 



Pro lie Phe Asn Pro lie lie Tyr Ser Phe Arg Asn 
225 230 235 236 



(8) INFORMATION POUR LA SEQ ID NO: 7 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 37 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR7 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7 

Pro Arg Tyr Leu Phe Leu Gly Asn Leu Ser Leu Ala Asp lie Gly He 
15 10 15 

Ser Thr Thr Thr He Pro Gin Met Val Val Asn He Gin Arg Lys Arg 
20 25 30 

Lys Thr He Ser Tyr Ala Gly Cys Leu Thr Gin Val Cys Phe Val Leu 
35 40 45 

He Phe Ala Gly Ser Glu Asn Phe Leu Leu Ala Ala Met Ala Tyr Asp 
50 55 60 

Arg Tyr Ala Ala lie Cys His Pro Leu Arg Tyr Thr Ala He Met Asn 
65 70 75 80 

Pro His Leu Cys Val Leu Leu Val Met He Ser Leu Ser He Ser Thr 
85 90 95 

Val Asp Ala Leu Leu His Ser Leu Met Leu Leu Arg Leu Ser Phe Cys 
100 105 HO 

Thr Asp Leu Glu He Pro His Phe Phe Cys Glu Leu Asp Gin Val He 
115 120 125 

Thr Leu Ala Cys Ser Asp Thr Leu He Asn Asn Leu Leu He Tyr Val 
130 135 140 

Thr Ala Gly He Phe Ala Gly Val Pro Leu Ser Gly He He Phe Ser 
145 150 155 160 

Tyr Leu His He Val Ser Ser Val Leu Arg Met Pro Ser Pro Gly Gly 
165 170 175 

Val Tyr Lys Ala Phe Ser Thr Cys Gly Ser His Leu Ser Val Val Cys 
180 185 190 

Leu Phe Tyr Gly Thr He Phe Gly Val Tyr He Ser Ser Ala Val Thr 
195 200 205 
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Asp Ser Gin Arg Lys Gly Ala Val Ala Ser Val Met Tyr Ser Val Val 
210 215 220 

Pro Gin Met Leu Asn Pro lie lie Tyr Thr Leu Arg Asn 

225 230 235 237 



(9) INFORMATION POUR LA SEQ ID NO : 8 : 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 176 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 8 



(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 8 : 

Gin Ala Leu Ala Tyr Asp Arg Phe Val Ala lie Cys His Pro Leu His 
15 10 15 

Tyr Leu Val lie Met Ser Pro Arg His Cys Gly Phe Leu Thr Leu Val 
20 25 30 

Ser Phe Leu Leu Ser Leu Leu Asp Ser Gin Leu His Ser Phe Met Thr 
35 40 45 

Leu Asn lie Thr Ser Phe Lys Asp Val Glu lie Ser Asn Phe Phe Cys 
50 55 60 

Asp Pro Ser Gin Leu Leu Asn Leu Ser Cys Ser Asn Thr Phe Ser Asp 
65 70 75 80 

Asn He Val Lys Tyr Phe Leu Gly Ala Phe Tyr Gly Leu Phe Pro He 
85 90 -95 

Ser Gly He Leu Phe Ser Tyr Tyr Lys He He Ser Ser He Leu Arg 
100 105 110 

He Pro Ser Leu Gly Gly Lys Tyr Lys Ala Phe Ser Thr Cys Gly Ser 
115 120 125 

His Leu Ala Val Val Cys Leu Phe Leu Val Thr Ala Ser Thr Val Tyr 
130 135 140 

Leu Gly Ser Val Ala Ser His Ser Pro Arg Asn Asp Val Val Ala Ser 
145 150 155 160 

Leu Met Tyr Thr Val Val Thr Pro Met Leu Asn Pro Phe lie Cys Ser 
165 170 175 176 



FEUILLE DE REMPLACEMENT (REGLE 26) 



(10) INFORMATION POUR LA SEQ ID NO: 9 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 6 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE : proteine 
{ ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 9 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9 : 

Gin Ala Leu Ala Tyr Asp Arg Phe Val Ala He Cys Tyr Pro Leu His 
15 10 15 

Tyr Met Val He Met Asn Ser Arg Arg Cys Gly Leu Leu He Leu Val 
20 25 30 

Ser Trp He Met Ser Ala Leu His Ser Leu Leu Gin Gly Leu Met Met 
35 40 45 

Leu Arg Leu Ser Phe Cys Thr Asp Leu Glu He Ser His Phe Phe Cys 
50 55 60 

Glu Leu Asn His Leu Val His Leu Ala Cys Ser Asp Thr Phe Leu Asn 
65 70 75 80 

Glu Val Val He Tyr Phe Ala Ala Val Leu Leu Ala Gly Gly Pro Leu 
85 90 95 

Ala Gly He Leu Tyr Ser Tyr Cys Lys He Val Ser Ser tie His Ala 
100 105 110 

He Ser Ser Ala Gin Gly Lys Tyr Lys Ala Phe Ser Thr Cys Ala Ser 
115 120 125 

His Leu Ser Val Val Ser Leu Phe Tyr Cys Thr Ser Pro Gly Val Tyr 
130 135 140 

Leu Ser Ser Ala Val Thr Gin Asn Ser His Ser Thr Ala Thr Ala Ser 
145 150 155 160 

Val Met Tyr Ser Val Val Thr Pro Met Leu Asn Pro Phe He Cys Ser 
165 170 175 176 



(11) INFORMATION POUR LA SEQ ID NO: 10 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 176 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
(ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR10 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO; 10 : 



FEUILLE DE REMPLACEMENT (REGLE 26) 



Ill 



Gin Ala Leu Ala Tyr Asp Arg Phe Val Ala lie Cys His Pro Leu Kis 
15 10 15 

Tyr Pro Arg lie Met Ser Gin Asn Leu Cys Phe Leu Leu Val Val Val 
20 25 30 

Ser Trp Val- Leu Ser Ser Ala Asn Ala Leu Leu His Thr Leu Leu Leu 
35 40 45 . 

Ala Arg Leu Ser Phe Leu Arg Gly lie Thr Leu Pro His Phe Phe Cys 
50 55 60 

Asp Leu Ser Ala Leu Leu Lys Leu Ser Ser Ser Asp Thr Thr lie Asn 
65 70 75 80 

Gin Leu Ala lie Leu Thr Ala Gly Ser Ala Val Val Thr Leu Pro Phe 
85 90 95 

Met Cys He Leu Val Ser Tyr Gly His He Gly Ala Thr He Leu Arg 
100 105 110 

Arg Pro Ser Leu Lys Gly He Cys Lys Ala Leu Ser Thr Cys Gly Ser 
115 120 125 

His Leu Ser Val Val Ser Val Tyr Tyr Gly Ala Val He Ala Leu Tyr 
130 135 140 

He Val Pro Ser Ser Asn Ser Thr Asn Asp Lys Asp He Ala Val Ser 
145 150 155 160 



Val Leu Tyr Thr Leu Val He Pro Met Leu Asn Pro Phe He Cys Ser 
165 170 175 176 



(12) INFORMATION POUR LA SEQ ID NO: 11 : 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 176 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMORll 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11 : 

Gin Ala Leu Ala Tyr Asp Arg Phe Leu Ala He Cys Tyr Pro Leu His 
15 10 15 

Tyr Thr Val He Met Asn Pro Arg Leu Cys Gly Phe Ser He Leu Val 

20 . 25 30 

Ser Phe Leu Leu Ser Leu Leu Asp Ser Gin Leu His Asn Leu Met He 
35 40 45 

Leu Gin He Thr Ser Phe Lys Asp Val Glu He Ser Ser Phe Phe Cys 
50 55 60 

Asp Pro Ser Gin Leu Leu Asn Leu Ser Cys Ser Asp Asn Tyr Ser He 
65 70 75 80 
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Asn Thr Gly Lys Tyr Val Leu Phe Ala Leu Tyr Ser Phe Phe Pro lie 
85 90 95 



Ser Gly lie Leu Phe Ser Tyr Tyr Lys lie lie Ser Ser lie Leu Arg 
100 105 110 



lie Pro Ser Ser Gly Gly Lys Tyr Lys Ala Phe Ser Thr Cys Gly Ser 
115 120 125 

His Leu Ala Val Phe Cys Leu Phe Leu Gly Thr Gly Thr Ala Val Tyr 
130 135 140 

Phe Gly Ser Ala Val Ser His Ser Pro Arg Glu Asn Val Val Ser Ser 
145 150 155 160 

Val Met Tyr Thr Val Val Thr Pro Met Leu Asn Pro Phe lie Cys Ser 
165 170 175 176 



(13) INFORMATION POUR LA SEQ ID NO: 12 : 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 176 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR12 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12 : 

Gin Ala Leu Ala Tyr Asp Arg Phe Val Ala He Cys His Pro Leu His 
15 10 15 

Tyr Pro Thr lie Met Asn Pro Arg Phe Cys Gly Phe Leu Val Leu Val 
20 25 30 

Ser Phe Leu Val Ser Leu Leu Glu Ser Gin Leu His Asn Leu He Ala 
35 40 45 

Leu Gin Phe Thr Thr Phe Lys Asp Val Lys He Ala Asn Phe Phe Cys 
50 55 60 

Asp Pro Ser Gin Val Leu Ser Leu Ser Cys Ser Gly Thr Phe He Asn 
65 70 75 80 

He He Val Met Tyr Phe Val Gly Ala Leu Phe Gly Val Phe Pro He 
85 90 95 

Ser Gly He Leu Phe Ser Tyr Tyr Lys He Val Ser Thr He Leu Arg 
100 105 110 

lie Pro Ser Ser Gly Gly Lys Tyr Lys Ala Phe Ser Thr Cys Gly Ser 
115 120 125 

His Leu Ser Val Val Cys Leu Phe Tyr Gly Thr Gly Phe Gly Val Tyr 
130 135 140 
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Leu Gly Ser Ala Val Ser His Ser Ser Arg Lys Ser Ala Val Ala Ser 

145 150 155 160 

Val Met Tyr Thr Val Val Thr Pro Met Leu Asn Pro Phe lie Cys Ser 

165 170 175 176 



(14) INFORMATION POUR LA SEQ ID NO: 13 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 168 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR13 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13 : 

Gly Ala He Arg Phe Pro Leu His Asn Thr Thr He Met Ser Pro Lys 
15 10 15 

Leu Gly Leu Phe Leu Val Val Leu Ser Trp Val Leu Thr Met Phe His 
20 25 30 

Ala Met Leu His Thr Leu Leu Met Ala Arg Leu Cys Phe Cys Ala Glu 
35 40 45 

Asn Met He Pro His Phe Phe Cys Asp Met Ser Ala Leu Leu Lys Leu 
50 55 60 

Ser Cys Ser Asn Thr His Val Asn Glu Leu Val He Phe He Thr Ala 
65 70 75 80 

Gly Leu lie Leu Leu He Pro Leu Val Leu He Leu Leu Ser Tyr Gly 
85 90 95 

His He Val Ser Ser He Leu Lys Val Pro Ser Ala Arg Gly He His 
100 105 HO 

Lys Thr Phe Ser Thr Cys Gly Ser His Leu Ser Val Val Ser Leu Phe 
115 120 125 

Tyr Gly Thr Val He Gly Leu Tyr Leu Cys Pro Ser Ala Asn Asn Ser 
130 135 140 

Thr Val Lys Asp Thr Val Met Ala Leu Met Tyr Thr Val Val Thr Pro 
145 150 155 160 

Met Leu Asn Pro Phe He Cys Ser 
165 168 



FEUILLE DE REMPLACEMENT (REGLE 26) 



(15) INFORMATION POUR LA SEQ ID NO: 14 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 176 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR14 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 14 : 

Gin Ala Leu Ala Tyr Asp Arg Phe Leu Ala lie Cys His Pro Leu His 
15 10 15 

Tyr Thr Ala lie Met Asn Pro Arg Leu Cys Gly Leu Leu Val Leu Val 
20 25 30 

Cys Trp lie Leu Ser Val Leu His Ala Leu Leu Gin Ser Leu Met Val 
35 40 45 

Leu Arg Leu Ser Phe Cys Arg Asp lie Glu lie Pro His Phe Phe Cys 
50 55 60 

Glu Leu Asn Gin Val Val Gin Leu Ala Cys Phe Asp Asn Leu Leu Asn 
65 70 75 80 

Asp He Val Met Asn Phe Ala Leu Val Leu Leu Ala Thr Cys Pro Leu 
85 90 95 

Ala Gly He Leu Tyr Ser Tyr Ser Lys He Val Ser Ser He Arg Ala 
100 105 110 

He Ser Ser Ala Gin Gly Lys Tyr Lys Ala Phe Ser Thr Cys Ala Ser 
115 120 125 

His Leu Ser Val Val Ser Leu Phe Tyr Cys Thr Gly Leu Gly Val Tyr 
130 135 140 

Leu Ser Ser Ala Val Ser His Ser Ser Arg Ser Ser Ala Thr Ala Ser 
145 150 155 160 

Val Met Tyr Thr Val Val Thr Pro Met Leu Asn Pro Phe He Cys Ser 
165 170 175 176 



(16) INFORMATION POUR LA SEQ ID NO: 15 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 119 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR15 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15 : 
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His Leu Cys Arg Leu His Leu Thr Val Leu Lys Leu Ala Cys Ser Asp 

15 10 15 

Thr Leu He Asn Asn He Val Val Phe Ser Met He He Val Leu Gly 
20 25 30 

Val Phe Pro- Leu Ser Gly He Leu Phe Ser Tyr Ser Gin He Phe Ser 
35 40 45 

Ser He Leu Arg lie Ser Ser Asp Arg Gly Lys Tyr Lys Val Phe Ser 
50 55 60 

Thr Cys Gly Ser His Leu Leu Val Val Ser Leu Phe Tyr Gly Ser Ser 
65 70 75 80 

Leu Gly Val Tyr Leu Ser Ser Val Ala Thr Leu Ser Ser Arg Met Thr 
85 90 95 

Leu Met Ala Ser Val Met Tyr Thr Met Val Thr Pro Met Leu Asn Pro 
100 105 110 

lie lie Tyr Thr Leu Arg Asn 
115 119 



(17) INFORMATION POUR LA SEQ ID NO: 16 : 

(i) CARACTRERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 159 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix ) C ARACTERI STIQUES 

(A) NOM/CLE: AMOR16 

(xi) . DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16 

Pro Met Tyr Leu Phe Leu Gly Asn Leu Ser Phe Leu Glu lie Leu Tyr 
15 10 15 

Thr Ser Thr Val Val Pro Lys Met Leu Glu Gly Phe Leu Gin Val Ala 
20 25 30 

Ala He Ser Val Thr Gly Cys Leu Thr Gin Phe Phe lie Phe Gly Ser 
35 40 45 

Leu Ala Thr Ala Glu Cys Phe Leu Leu Ala Val Met Ala Tyr Asp Arg 
50 55 60 

Phe Leu Ala lie Cys Tyr Pro Leu Arg Tyr Pro Leu Leu Met Gly Pro 
65 70 75 80 

Arg Trp Cys Met Gly Leu Val Val Thr Ala Trp Leu Ser Gly Phe Met 
85 90 95 

Val Asp Glu Leu Val Val Val Leu Met Ala Gin Leu Arg Phe Cys Gly 
100 105 110 

Ser Asn Arg lie Asp His Phe Tyr Cys His Phe Met Pro Leu Val Val 
115 120 125 
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Leu Ala Cys Ser As? Pro Arg Val Ala Gin Val Thr Thr Phe Val Leu 
130 135 140 

Ser Val Val Pro Leu Thr Val Pro Phe Gly Leu He Leu Thr Ser 

145 150 155 159 



( 18 ) INFORMATION POUR LA SEQ ID NO: 17 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 113 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR17 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17 : 

Glu Asp Leu Cys Ala Arg Leu Lys Arg Ser Arg Ser Asp Thr Thr He 
15 10 15 

Asn Glu Val Gly He Leu Thr Ala Gly Ser Ala Val Val Thr Leu Pro 
20 25 30 

Phe Met Cys He Leu Val Ser Tyr Gly His Met Gly Ala Thr He Leu 
35 40 45 

Arg Arg Pro Ser Leu Lys Gly Met Cys Lys Ala Leu Ser Thr Cys Gly 
50 55 60 

Ser His Leu Cys Val Val Ser Val Tyr Tyr Gly Ala Val He Ala Leu 
65 70 75 80 

Tyr He Val Pro Ser Ser Asn Ser Thr Asn Asp Lys Asp He Ala Val 
85 90 95 

Ser Val Leu Tyr Thr Leu Val He Pro Met Leu Asn Pro Phe lie. Cys 
100 105 110 

Ser 
113 

(19) INFORMATION POUR LA SEQ ID NO: 18 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 6 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE : proteine 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AM0R18 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18 : 
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Gin Ala Leu Gly Tyr Asp Arg Phe Val Ala Met Cys His Pro Gly Gin 
15 10 15 

Tyr Leu Val He Met Ser Pro Arg His Gly Gly Phe Leu Thr Leu Val 

20 25 30 

Ser Phe Leu Leu Ser Leu Leu Asp Ser Gin Leu His Ser Phe Met Thr 
3: 40 45 

Leu Asn lie Thr Ser Phe Lys Asp Val Glu He Ser Asn Phe Phe Cys 
50 55 60 

Asp Pro Ser Gin Leu Leu Asn Leu Ser Cys Ser Asn Thr Phe Ser Asp 
65 70 75 80 

Asn He Vol Lys Tyr Phe Leu Gly Ala Phe Tyr Gly Leu Phe Pro He 
85 90 95 

Ser Gly lie Leu Phe Ser Tyr Tyr Lys He He Ser Ser He Leu Arg 
100 105 110 

He Pro Ser Leu Gly Gly Lys Tyr Lys Ala Phe Ser Thr Cys Gly Ser 
115 120 125 

His Leu Ala Val Val Cys Leu Phe Leu Val Thr Ala Ser Thr Val Tyr 
130 135 140 

Leu Gly Ser Val Ala Ser His Ser Pro Arg Asn Asp Val Val Ala Ser 
145 150 155 160 

Leu Met Tyr Thr Val Val Thr Pro Met Leu Asn Pro Phe He Cys Ser 
165 170 175 176 



(20) INFORMATION POUR LA SEQ ID NO: 19 ; 

(i) CARACTRERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 176 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR19 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19 : 

Gin Ala Leu Ala Tyr Asp Arg Phe Leu Ala He Cys His Pro Leu His 
15 10 15 

Tyr Leu Val He Met Ser Pro Arg His Cys Gly Phe Leu Thr Leu Val 
20 25 30 

Ser Phe Leu Leu Ser Leu Leu Asp Ser Gin Leu His Ser Phe Met Thr 
35 40 45 

Leu Asn He Thr Ser Phe Lys Asp Val Glu He Ser Asn Phe Phe Cys 
50 55 60 

Asp Pro Ser Gin Leu Leu Asn Leu Ser Cys Ser Asn Thr Phe Ser Asp 
65 70 75 80 
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Asn lie Val Lys Tyr Phe Leu Gly Ala Phe Tyr Gly Leu Phe Pro lie 
85 90 95 



Ser Gly lie Leu Phe Ser Tyr Tyr Lys lie lie Ser Ser lie Leu Arg 
100 105 110 

He Pro Ser Leu Gly Gly Lys Tyr Lys Ala Phe Ser Thr Cys Gly Ser 
115 120 125 

His Leu Ala Val Val Cys Leu Phe Leu Val Thr Ala Ser Thr Val Tyr 
130 135 140 

Leu Gly Ser Val Ala Ser His Ser Pro Arg Asn Asp Val Val Ala Ser 
145 150 155 160 



Leu Met Tyr Thr Val Val Thr Pro Met Leu Asn Pro Phe lie Cys Ser 
165 170 175 176 



(21) INFORMATION POUR LA SEQ ID NO: 20 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 176 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix ) CARACTERISTIQUES 

(A) NOM/CLE: AMOR20 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 20 : 

Gin Ala Leu Ala Tyr Asp Arg Phe Leu Ala He Cys His Pro Arg His 
15 10 15 

Tyr Leu Val He Met Ser Pro Arg His Cys Gly Phe Leu Thr Leu Val 
20 25 30 

Ser Phe Leu Leu Ser Leu Leu Asp Ser Gin Leu His Ser Phe Met Thr 
35 40 45 

Leu Asn He Thr Ser Phe Lys Asp Val Glu He Ser Asn Phe Phe Cys 
50 55 60 

Asp Pro Ser Gin Leu Leu Asn Leu Ser Cys Ser Asn Thr Phe Ser Asp 
65 70 75 80 

Asn He Val Lys Tyr Phe Leu Gly Ala Phe Tyr Gly Leu Phe Pro He 
85 90 95 

Ser Gly He Leu Phe Ser Tyr Tyr Lys He He Ser Ser He Leu Arg 
100 105 HO 

He Pro Ser Leu Gly Gly Lys Tyr Lys Ala Phe Ser Thr Cys Gly Ser 
115 120 125 

His Leu Ala Val Val Cys Leu Phe Leu Val Thr Ala Ser Thr Val Tyr 
130 135 140 
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Leu Gly Ser Val Ala Ser His Ser Pro Arg Asn Asp Val Val Ala Ser 
145 150 155 160 



Leu Met Tyr Thr Val Val Thr Pro Met Leu Asn Pro Phe lie Cys Ser 
165 170 175 176 



(22) INFORMATION POUR LA SEQ ID NO: 21 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 112 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR21 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21 

Pro Met Tyr Leu Phe Leu Gly Asn Leu Ser Phe Met Asp lie Cys Phe 
15 10 15 

Thr Thr Val Val Val Pro Lys Met Leu Ala Asn Leu Leu Ser Glu Thr 
20 25 30 

Lys Gly He Ser Tyr Val Gly Cys Leu Val Gin Met Tyr Phe Phe Met 
35 40 45 

Ala Phe Gly Asn Thr Asp Ser Tyr Leu Leu Ala Ser Met Ala He Asp 
50 55 60 

Arg Leu Val Ala He Cys Asn Pro Leu His Tyr Asp Val Ala Met Arg 
65 70 75 80 

Pro His Arg Cys Leu Leu Met Leu Leu Gly Ser Cys Thr He Ser His 
85 90 95 

Leu His Ala Leu Phe Arg Val Leu Leu Met Ser Arg Leu Ser Phe Cys 
100 105 110 112 



(23) INFORMATION POUR LA SEQ ID NO:22 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 119 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR22 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22 

His Leu Cys Arg Leu His Leu Thr Val Leu Lys Leu Ala Cys Ser Asp 
15 10 15 
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Thr Leu lie Asn Asr. He Val Val 
20 

Val Phe Pro Leu Ser Gly He Leu 

35 ■ 40 



Phe Ser Met He He Val Leu Gly 
25 30 

Phe Ser Tyr Ser Gin He Phe Ser 
45 



Ser He Leu Arg He Ser Ser Asp Arg Gly Lys Tyr Lys Val Phe Ser 
50 55 60 

Thr Cys Gly Ser His Leu Leu Val Val Ser Leu Phe Tyr Gly Ser Ser 
65 * 70 75 80 

Leu Gly Val Tyr Leu Ser Ser Val Ala Thr Leu Ser Ser Arg Met Thr 
85 90 95 

Leu Met Ala Ser Val Met Tyr Thr Met Val Thr Pro Met Leu Asn Pro 
100 105 110 

He He Tyr Thr Leu Arg Asn 
115 119 



(24) INFORMATION POUR LA SEQ ID NO: 23 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 141 

(B) TYPE: acides amines 

(ii) TYPE DE MOLECULE: protdine 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR2 3 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23 

Trp Ser Leu Leu Glu Ser Gin Leu His Ser Leu Arg Thr Leu Asn Met 
15 10 15 

Thr Ser Phe Arg Aso Val Glu Ser Ser Asn Leu Leu Cys Asp Pro Ser 
20 25 30 

Gin Met Leu Asn Leu Ser Cys Ser Asn Thr Phe Ser Asp Asn lie Val 
35 40 45 

Lys Tyr Phe Leu Gly Ala Phe Tyr Gly Leu Phe Pro lie Ser Gly lie 
50 55 60 

Leu Phe Ser Tyr Tyr Lys lie lie Ser Ser He Leu Arg lie Pro Ser 
65 * 70 75 80 

Leu Gly Gly Lys Tyr Lys Ala Phe Ser Thr Cys Gly Ser His Leu Ala 
85 90 95 

Val Val Cys Leu Phe Leu Val Thr Ala Ser Thr Val Tyr Leu Gly Ser 
100 105 110 

Val Ala Ser His Ser Pro Arg Asn Asp Val Val Ala Ser Leu Met Tyr 
115 120 125 
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Thr Val Val Thr Pro Met Leu Asn Pro Phe lie Cys Ser 
130 135 140 141 
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(25) INFORMATION POUR LA SEQ ID NO: 24 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 711 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 
<D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN 
(ix) CARACTERISTIQUES 

(A) NOM/CLE : AMOR 1 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 24 : 



CCT 


ATG 


TAT 


TTG 


TTC 


CTT 


GGC 


AAC 


TTG 


TCC 


TTC 


CTG 


GAC 


CTC 


AGC 


TTC 


48 


ACC 


ACC 


AGC 


TCC 


ATC 


CCC 


CAG 


CTG 


CTC 


CAC 


AAC 


CTG 


AGT 


GGC 


CGT 


GAC 


96 


AAG 


ACC 


ATC 


AGC 


TAT 


GTG 


GGC 


TGC 


GTG 


GTC 


CAG 


CTC 


TTC 


CTG 


TTC 


CTG 


144 


GGC 


CTG 


GGT 


GGA 


GTG 


GAG 


TGT 


CTA 


CTG 


CTG 


GCC 


GTC 


ATG 


GCC 


TAT 


GAC 


192 


AGG 


TTC 


GTG 


GCC 


GTC 


TGC 


AAG 


CCC 


CTG 


CAC 


TAC 


ACG 


GTG 


ATC 


ATG 


AGT 


240 


TCC 


AGG 


CTC 


TGC 


CTG 


GGC 


TTG 


GTG 


TCA 


GTG 


GCC 


TGG 


GGC 


TGT 


GGA 


ATG 


288 


GCC 


AAC 


TCC 


TTG 


GTC 


ATG 


TCT 


CCA 


GTG 


ACC 


CTA 


CAA 


TTA 


CCC 


CGC 


TGC 


336 


GGG 


CAC 


AAT 


AAG 


GTG 


GAC 


CAT 


TTC 


CTG 


TGT 


GAG 


ATG 


CCA 


GCC 


CTG 


ATC 


384 


CGC 


ATG 


GCC 


TGC 


GTC 


AAC 


ACA 


GTG 


GCC 


ATA 


GAA 


GGC 


ACT 


GTC 


TTT 


GTC 


432 


CTG 


GCC 


GTG 


GGC 


ATC 


GTG 


CTG 


TCT 


CCC 


CTG 


GTC 


TTC 


ATC 


TTG 


GTG 


TCC 


480 


TAT 


GGC 


CAC 


ATC 


GTC 


AGG 


GCG 


GTG 


TTC 


AGA 


ATC 


CAG 


TCG 


TCC 


TCA 


GGA 


528 


AGA 


CAC 


AGA 


ATC 


TTC 


AAC 


ACC 


TGT 


GGC 


TCC 


CAC 


CTC 


ACC 


GTG 


GTC 


TCC 


57 6 


CTG 


TTC 


TAC 


GGG 


AAC 


ATC 


ATC 


TAC 


ATG 


TAC 


ATG 


CAG 


CCA 


GGA 


AGC 


AGG 


624 


TCC 


TCC 


CAG 


GAC 


CAG 


GGC 


AAG 


TTC 


CTC 


ACC 


CTC 


TTC 


TAC 


AAC 


ATC 


GTC 


672 


ACC 


CCC 


CTC 


CTG 


AAC 


CCC 


TTC 


ATC 


TAT 


TCC 


CTC 


AGG 


AAT 








711 



(26) INFORMATION POUR LA SEQ ID NO: 25 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 711 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 2 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25 : 



CCC 


ATG 


TAT 


TTG 


TTC 


CTT 


GGT 


AAC 


CTG 


TCC 


TTT 


GTG 


GAA 


GTC 


TGT 


TTA 


48 


ACC 


TCC 


ACC 


ACG 


GTC 


CCC 


AAG 


ATA 


CTG 


GTG 


AAC 


ACG 


CAG 


ACA 


CTC 


AGC 


96 


AAA 


GAC 


ATC 


TCC 


TAC 


AGA 


GGC 


TGC 


CTT 


ACT 


CAG 


GTG 


TAT 


TTT 


TTA 


ATG 


144 


GTT 


TTT 


GCA 


GGT 


ATG 


GAT 


AAT 


TTC 


CTT 


CTG 


ACT 


GTG 


ATG 


GCC 


TTT 


GAC 


192 


CGC 


TTT 


GTG 


GCC 


ATC 


TGC 


TAC 


CCC 


CTG 


AAC 


TAT 


ACG 


GTC 


ATC 


ATG 


AAC 


240 


CCC 


AGG 


CTC 


TGT 


GTC 


CTC 


CTG 


GTG 


CTG 


CTG 


TCT 


TGG 


CTC 


ATC 


ATG 


TTC 


288 


TGG 


GTG 


TCC 


TTA 


CTT 


CAC 


ATT 


CTA 


CTC 


CTG 


AAG 


CGA 


CTG 


ACC 


TTC 


TCC 


336 


AGT 


GGC 


ACT 


GCA 


GTC 


CCT 


CAT 


TTC 


TTC 


TGT 


GAA 


CTG 


TCT 


CAG 


CTT 


CTC 


384 


AAA 


GCA 


ACC 


AGC 


TCT 


GAC 


ACC 


CTC 


GTC 


AAT 


ATC 


ATC 


TTA 


CTG 


TAT 


GTG 


432 


GTG 


ACT 


GCC 


CTG 


CTG 


GGT 


ATC 


TTC 


CCT 


GCC 


ACT 


GGG 


ATC 


CTC 


TAC 


TCC 


480 


TAC 


TCT 


CAG 


ATC 


GTC 


TCT 


TCC 


TTA 


CTG 


AGG 


ATG 


TCC 


TCC 


TCT 


GTG 


GGC 


528 


AAG 


TCT 


AAA 


GCC 


TTC 


TCC 


ACC 


TGT GGT 


TCC 


CAC 


CTC 


TGT 


GTG 


GTC 


TCC 


576 



FEUILLE DE REMPLACEMENT (REGLE 26) 



TTG TTC TAT GGA ACA GGT CTT GGG GTT CAC CTC AGT TCT GCC ATG AAC 
CAT CCT TCT CAG GGA AAC ATG ATT GCC TCC GTG ATG TTA CAC TGT GGT 
CAC CCC ATG CTG AAC CCC ATC ATC TAC ACC CTC CGG AAC 



624 
672 
711 



(27) INFORMATION POUR LA SEQ ID NO: 26 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 711 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADM 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 3 







(xi) 


DESCRIPTION i 


DE LA SEQUENCE: SEQ 


ID 


NO;26 : 




CCC 


ATG 


TAC 


TTG 


TTT 


CTT 


GGC 


AAT 


CTG 


TCC 


TTC 


CTG 


GAG 


GTC 


TGG 


TAC 


48 


ACC 


ACG 


GCC 


GCA 


GTG 


CCC 


AAA 


GCC 


CTG 


GCC 


ATC 


CTG 


CTG 


GGG 


AGG 


AGC 


96 


CAG 


AGC 


ATC 


TCC 


TTC 


ATC 


AGC 


TGC 


CTC 


CTG 


CAG 


ATG 


TAC 


CTG 


GTC 


TTC 


144 


TCG 


CTG 


GGC 


TGC 


ACG 


GAG 


TAC 


TTC 


CTC 


CTT 


GTG 


GCC 


ATG 


GCT 


TAT 


GAC 


192 


CGC 


TAT 


GTG 


GCC 


ATC 


TGC 


TTC 


CCC 


CTG 


CAC 


TAC 


ACC 


ACC 


ATC 


ATG 


AGC 


240 


CTC 


AAG 


CTC 


TGT 


CTC 


TCC 


CTG 


GTG 


GTG 


CTG 


TCC 


TGG 


GTG 


CTG 


ACC 


ATG 


288 


CTC 


CAT 


GCC 


CTG 


TTG 


CAC 


ACT 


CTG 


CTT 


GTG 


GTC 


AGA 


TTG 


TCT 


TTC 


TGT 


336 


TCG 


GAC 


AAT 


GTA 


ATC 


CCA 


CAC 


TTT 


TCC 


TGT 


GAA 


ATA 


TCT 


GCT 


TTA 


TTG 


384 


AAG 


CTG 


GCC 


TGC 


TCC 


AAC 


ACT 


CAT 


GTC 


AAT 


GAA 


CTG 


GTG 


ATA 


TTT 


ATC 


432 


ACG 


GGA 


GGA 


CTT 


GTT 


ATT 


GTC 


ACC 


CCA 


TTT 


CTA 


CTC 


ATC 


CTT 


GGG 


TCC 


480 


TAT 


GTA 


CAA 


ATT 


TTC 


TCC 


TCC 


ATC 


CTC 


AAG 


GTC 


CCT 


TCT 


GCT 


CGT 


GGT 


528 


ATC 


CAC 


AAG 


GCC 


TTC 


TCT 


ACC 


TGT 


GGC 


TCC 


CAC 


CTC 


TCT 


GTG 


GTG 


TCA 


576 


CTG 


TTC 


TAT 


GGG 


ACA 


ATT 


ATT 


GGT 


CTC 


TAT 


TTA 


TGT 


CCA 


TCA 


GCT 


AAT 


624 


AAT 


TCT 


ACT 


GTG 


AAA 


GAC 


ACT 


GTC 


GTG 


GCT 


CTG 


ATG 


TAC 


ACG 


GTG 


GTG 


672 


ACT 


CCC 


ATG 


CTG 


AAC 


CCC 


TTC 


ATC 


TAC 


ACC 


CTC 


CGA 


AAT 








711 



(28) INFORMATION POUR LA SEQ ID NO: 27 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 702 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 4 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 27 : 



CCC ATG TAC TTG TTT CTC GGT AAC CTG TCC TTT ATC GAT GTC TGC CAC 48 

TCC ACT GTC ACT GTG CCC AAG ATG CTG AGA GAC ACC TGG TCA GAG GAG 96 

AAG CTC ATC TCC TTT GAT GCC TGT GTG ACC CAG ATG TTC TTC CTG CAC 144 

CTC TTT GCC TGC ACA GAG ATC TTC CTC CTC ACC GTC ATG GCC TAT GAT 192 

CGT TAT GTG GCC ATC TGT AAA CCC CTG CAG TAC ATG ACA GTG ATG AAT 24 0 

TGG AAG GTA TGT GTG CTG CTG GCT GTG GCC CTC TGG GCA GGA GGA ACC 288 



FEUILLE 



DE REMPLACEMENT (REGLE 26) 



ATC 


CAC 


TCC 


ATA 


TCC 


CTG 


ACC 


TCC 


CTC 


ACC 


ATC 


AAG 


CTG 


CCC 


TAC 


TGT 


336 


GGT 


CCT 


GAT 


GAG 


ATT 


GAC 


AAC 


TTC 


TTC 


TGT 


GAC 


GTG 


CCG 


CAG 


GTG 


ATC 


384 


AAA 


TTG 


GCC 


TGC 


ACT 


GAC 


ACC 


CAC 


ATC 


ATT 


GAG 


ATC 


CTC 


ATC 


GTC 


TCC 


432 


AAC 


AGT 


GGG 


CTG 


ATC 


TCC 


GTG 


GTC 


TGT 


TTT 


GTC 


GTC 


CTT 


GTG 


GTG 


TCC 


480 


TAT 


GCA 


GTC 


ATC 


CTG 


GTG 


AGT 


CTG 


CGG 


CAG 


CAG 


ATC 


TCC 


GAG 


GGC 


AGG 


528 


CGG 


AAG 


GCC 


CTG 


TCC 


ACC 


TGT 


GCA 


GCC 


CAC 


CTC 


ACT 


GTG 


GTC 


ACA 


CTG 


576 


TTC 


CTG 


GGA 


CAC 


TGC 


ATC 


TTC 


ATC 


TAT 


TCC 


CGC 


CCA 


TCC 


ACC 


AGC 


CTC 


624 


CCA 


GAG 


GAC 


AAA 


GTG 


GTG 


TCT 


GTG 


TTT 


TTC 


ACT 


GCT 


GTC 


ACC 


CCT 


CTG 


672 


CTA 


AAC 


CCC 


TTC 


ATC 


TAC 


TCC 


CTC 


CGA 


AAT 














702 




(29) 


INFORMATION POUR 


LA 


SEQ 


ID 


NO: 


28 











(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 711 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 5 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 28 : 



CCC 


ATG 


TAT 


TTG 


TTC 


CTT 


GGT 


AAC 


TTG 


TCT 


CTC 


CTA 


GAG 


ATT 


GGC 


TAC 


48 


ACT 


TGC 


TCT 


GTC 


ATA 


CCC 


AAG 


ATG 


CTG 


CAG 


AGT 


CTT 


GTG 


AGT 


GAG 


GCC 


96 


CGA 


GGA 


ATC 


TCT 


CGG 


GAG 


GGT 


TGT 


GCC 


ACA 


CAG 


ATG 


TTT 


TTC 


TTT 


ACA 


144 


TTA 


TTT 


GCT 


ATC 


AGT 


GAG 


TGC 


TGC 


CTT 


TTG 


GCA 


GCC 


ATG 


GCT 


TTT 


GAC 


192 


CGC 


TAT 


ATG 


GCC 


ATA 


TGT 


TCC 


CCA 


CTC 


CAC 


TAT 


GCA 


ACA 


CGA 


ATG 


AGT 


240 


CGT 


GGG 


GTG 


TGT 


GCC 


CAT 


TTG 


GCA 


GTG 


GTT 


TCT 


TGG 


ACA 


GTG 


GGA 


TGC 


288 


ATG 


GTA 


GGC 


TTG 


GGC 


CAA 


ACC 


AAT 


TAT 


ATT 


TTC 


TCC 


TTA 


GAC 


TTC 


TGT 


336 


GGC 


CCC 


TGT 


GAG 


ATA 


GAC 


CAC 


TTC 


TTC 


TGT 


GAT 


CTC 


CCA 


CCT 


ATC 


CTG 


384 


GCA 


CTT 


GCT 


TGT 


GGG 


GAT 


ACA 


TCC 


CAT 


AAT 


GAG 


GCT 


GCG 


GTC 


TTT 


GTG 


432 


GTG 


GCA 


ATC 


CTT 


TGC 


ATT 


TCT 


AGC 


CCA 


TTT 


TTA 


TTG 


ATC 


GTT 


GCT 


TCC 


480 


TAT 


GGC 


AGA 


ATT 


CTA 


GCT 


GCA 


GTC 


CTG 


GTC 


ATG 


CCC 


TCC 


CCT 


GAG 


GGC 


528 


CGC 


CGG 


AAA 


GCT 


CTC 


TCC 


ACC 


TGT 


TCT 


TCC 


CAC 


TTA 


CTT 


GTA 


GTA 


ACG 


576 


CTC 


TTC 


TAT 


GGC 


TCA 


GGA 


TCT 


GTT 


ACC 


TAC 


TTG 


AGG 


CCC 


AAG 


GCT 


AGC 


624 


CAC 


TCA 


CCA 


GGA 


ATG 


GAT 


AAA 


CTG 


CTA 


GCC 


CTC 


TTC 


TAT 


ACC 


GTG 


GTG 


672 


ACA 


TCC 


ATG 


CTC 


AAC 


CCC 


ATC 


ATC 


TAC 


ACC 


CTC 


CGG 


AAC 








711 




(30) 


INFORMATION POUR 


LA 


SEQ 


ID 


NO; 


29 











(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 7 08 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 6 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 29 : 
CCC ATG TAC TTG TTC CTC GGT AAT TTG TCC TTC CTG GAG ATC CTT TAT 48 



FEUILLE DE REMPLACEMENT (REGLE 26) 



ACA 


TCC 


ACA 


GTG 


GTG 


CCG 


AAA 


ATG 


CTG 


GAG 


GGl 


TTC 


PT»P 

G IG 


PAP 1 

GAG 


PTP 
\j l L» 


PP A 
GGA 


9fi 

J o 


GCC 


ATC 


TCT 


GTG 


ACT 


GGT 


TGC 


TTG 


ACC 


CAG 


TTl 


1 IG 


ATP 
A I G 


TTT 
111 


P_PT 
GG A 


TPT 
IG I 


144 


CTA 


GCC 


ACA 


GCA 


GAA 


TGC 


TTC 


PfP * 

G I A 


GTG 


GC1 


GTT 


ATP 


PP A 


TAT 


PAT 
Vj A 1 


PGP 


192 


TTC 


TTG 


GCA 


ATC 


rue 


T JVP 
1 AC 


GGA 


G L 1 


Pfp 
GGG 


1 A 1 


pp» 

LLrt 


PTP 


PTG 


ATP, 


GGG 


PPT 


240 


AGA 


TGG 


TGC 


ATG 


GGG 


G 1G 


G 1\j 


GIG 


AGA 


LLL 




PTG 


TPT 


GGC 


TTC 


ATG 


288 


GTA 


GAT 


p ?» * ■ 


TTA 




ptp 
GIG 


GIG 


GIG 


A 1 G 


ppp 


PA^ 


ptg 


AGG 


TTC 


TGT 


GGC 


336 


TCC 


AA 1 




ATC 


GA I 


par 
GAG 


TTT 


1 AG 


TPT 
1G1 


oar* 

GAG 


TTC 


r\ 1 Vj 


PPT 


TTG 


GTG 


GTC 


384 


CTG 


GCT 




TCA 


GAl 


ppp 

GGG 


AGA 


G i A 


ppp 
GGG 


par 
GAG 




APA 


ACA 


TTT 
i i i 


GTT 


CTC 


432 


TCT 


GTA 


GTC 


TTC 


CTC 


AG 1 


GTT 


PP JS 

GGA 


TTT 


GGA 


G I vj 


ATT 
All 


PTG 


APA 


TPP 


TAT 


480 


GCT 


CGC 


ATC 


GTG 


GTG 


AG 1 


G l\» 


G IG 


RPR 

AGA 


GTT 


PPT 
LLi 


VJV, 1 


ggg 


GPP 


AGP 


AGG 


528 


AGA 


a ftp 

AAG 


GG a 


TTT 


TPP 

ILL 




1 VjL, 


tpp 

ILL, 


1 V_V_ 


TAP 


PTT 


OCT 


GTA 


GTG 


TCC 


ACC 


576 


TTC 


TAT 


GGA 


ACT 


CTC 


ATG 


GTC 


TTG 


TAC 


ATT 


GTG 


CCC 


TCA 


GCT 


GTC 


CAC 


624 


TCC 


CAG 


CTC 


CTC 


TCC 


AAG 


GTC 


TTT 


GCC 


TTG 


CTC 


TAT 


ACT 


GTG 


GTC 


ACT 


67 2 


CCC 


ATC 


TTC 


AAC 


CCC 


ATC 


ATC 


TAC 


TCC 


TTC 


CGG 


AAT 










708 



(31) INFORMATION POUR LA SEQ ID NO: 30 : 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 711 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADK 
(ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 7 



(xi) DESCRIPTION DE 



CCC 


AGG 


TAC 


TTG 


TTT 


CTT 


GGC 


AAT 


TTG 


AGC 


ACA 


ACC 


ACG 


ATC 


CCC 


CAG 


ATG 


GTG 


AAG 


ACC 


ATC 


AGT 


TAC 


GCA 


GGC 


TGC 


CTC 


ATT 


TTT 


GCT 


GGA 


TCG 


GAG 


AAC 


TTT 


CTC 


CGT 


TAC 


GCA 


GCC 


ATC 


TGC 


CAT 


CCC 


CTC 


CCC 


CAC 


CTG 


TGT 


GTC 


CTG 


CTG 


GTT 


ATG 


GTG 


GAT 


GCC 


CTG 


CTG 


CAC 


AGT 


CTG 


ATG 


ACA 


GAC 


CTG 


GAG 


ATC 


CCC 


CAC 


TTC 


TTC 


ACA 


CTG 


GCC 


TGT 


TCT 


GAC 


ACC 


CTC 


ATC 


ACA 


GCT 


GGG 


ATA 


TTT 


GCT 


GGT 


GTT 


CCT 


TAC 


CTT 


CAC 


ATT 


GTG 


TCC 


TCT 


GTC 


TTG 


GTG 


TAT 


AAA 


GCC 


TTT 


TCC 


ACC 


TGT 


GGC 


TTG 


TTC 


TAT 


GGG 


ACA 


ATT 


TTT 


GGG 


GTG 


GAC 


TCA 


CAG 


AGA 


AAA 


GGT 


GCA 


GTG 


GCC 


CCT 


CAG 


ATG 


CTG 


AAC 


CCC 


ATC 


ATC 


TAC 



(32) INFORMATION POUR LA 



SEQUENCE: SEQ ID NO: 30 : 



TCT 


TTG 


GCC 


GAC 


ATT 


GGG 


ATC 


48 


GTG 


AAC 


ATC 


CAG 


AGA 


AAG 


AGA 


96 


ACC 


CAG 


GTC 


TGC 


TTT 


GTC 


CTG 


144 


CTT 


GCA 


GCA 


ATG 


GCT 


TAT 


GAC 


192 


AGG 


TAC 


ACG 


GCC 


ATC 


ATG 


AAC 


240 


ATC 


TCC 


TTG 


TCC 


ATC 


AGC 


ACG 


288 


CTG 


CTG 


AGG 


CTG 


TCC 


TTC 


TGC 


336 


TGT 


GAA 


CTT 


GAT 


CAG 


GTG 


ATC 


384 


AAT 


AAC 


CTC 


CTG 


ATA 


TAT 


GTC 


432 


CTC 


TCT 


GGA 


ATC 


ATC 


TTC 


TCT 


480 


AGA 


ATG 


CCA 


TCA 


CCA 


GGA 


GGA 


528 


TCT 


CAC 


CTG 


TCT 


GTG 


GTC 


TGC 


57 6 


TAC 


ATT 


AGC 


TCT 


GCA 


GTG 


ACT 


624 


TCA 


GTG 


ATG 


TAC 


TCT 


GTG 


GTC 


672 


ACC 


CTC 


AGA 


AAC 








711 


SEQ 


ID 


NO: 


31 











(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 528 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(ix) CARACTERISTIQUES 



FEUILLE DE REMPLACEMENT (REGLE 26) 



(A) NOM/CLE: AMOR 8 



(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 31 : 



PA A 


ppt 


TTP. 
I 1 \y 


cirri 


TAT 


HAP 




TTT 


GTG 


GPP 


ATP 


TCT 


PAT* 


CCT 


PTP 


CAT 


48 


TAT 


PTP 


PTP 


ATT 
Mil 


ATC 


APP 
nuv. 


PPT 


PGP 


PAT 


TGT 


GPP 


TTP 
i i v 


TTA 
i in 


ACT 


TTG 


GTG 


96 


tp a 


111 


1 Iv? 


V- 1 


APT 


v 1 i 


TTG 


PAP 


TPP 


PAP 


PTP 


PAP 


APT 


TTP 

i 1 V- 


ATG 


APP 


144 


TTA 


AAT 


ATT 


ACC 


AGC 


TTC 


AAG 


GAT 


GTG 


GAA 


ATT 


TCT 


AAT 


TTC 


TTC 


TGT 


192 


nap 


PPT 


TPT 




PTP 


PTP 


A AT 


PTP 


TPP 


TGT 

1 O i 


TPP 


AAC 


ACC 


TTC 


TCT 


GAT 


240 


AAC 


ATT 


GTC 


AAG 


TAT 


TTT 


CTG 


GGA 


GCC 


TTC 


TAT 


GGC 


CTT 


TTT 


CCC 


ATC 


288 


TCA 


GGG 


ATC 


CTT 


TTC 


TCT 


TAC 


TAC 


AAA 


ATT 


ATT 


TCC 


TCC 


ATT 


CTG 


AGG 


336 


ATC 


CCC 


TCC 


TTA 


GGT 


GGG 


AAG 


TAC 


AAA 


GCC 


TTC 


TCC 


ACC 


TGT 


GGG 


TCT 


384 


CAC 


CTG 


GCA 


GTT 


GTT 


TGC 


TTA 


TTT 


TTA 


GTG 


ACA 


GCC 


TCC 


ACA 


GTG 


TAC 


432 


CTT 


GGA 


TCA 


GTT 


GCA 


TCA 


CAT 


TCT 


CCC 


AGA 


AAT 


GAT 


GTG 


GTG 


GCT 


TCT 


480 


CTG 


ATG 


TAC 


ACT 


GTG 


GTC 


ACC 


CCC 


ATG 


CTC 


AAT 


CCC 


TTC 


ATC 


TGC 


AGT 


528 




(33) 


INFORMATION POUR 


LA 


SEQ 


ID 


NO: 


32 











(i) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 528 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
( i x ) CARACTER I STIQUES 

(A) NOM/CLE: AMOR 9 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 32 : 

i 



CAA 


GCT 


TTG 


GCG 


TAT 


GAT 


AGG 


TTT 


GTG 


GCC 


ATC 


TGC 


TAC 


CCC 


CTG 


CAC 


48 


TAC 


ATG 


GTC 


ATC 


ATG 


AAC 


TCC 


CGG 


CGA 


TGT 


GGA 


TTG 


CTG 


ATT 


CTG 


GTG 


96 


TCT 


TGG 


ATC 


ATG 


AGT 


GCT 


CTT 


CAT 


TCC 


TTG 


TTA 


CAA 


GGT 


TTA 


ATG 


ATG 


144 


TTG 


AGA 


CTG 


TCC 


TTC 


TGC 


ACA 


GAT 


TTG 


GAA 


ATC 


TCC 


CAC 


TTT 


TTC 


TGT 


192 


GAA 


CTT 


AAT 


CAC 


CTG 


GTC 


CAT 


CTT 


GCC 


TGC 


TCT 


GAC 


ACC 


TTT 


CTC 


AAT 


240 


GAG 


GTG 


GTG 


ATA 


TAT 


TTT 


GCT 


GCT 


GTC 


TTG 


CTG 


GCT 


GGT 


GGC 


CCC 


CTC 


288 


GCT 


GGC 


ATC 


CTT 


TAC 


TCT 


TAC 


TGC 


AAG 


ATA 


GTC 


TCC 


TCC 


ATC 


CAT 


GCA 


336 


ATC 


TCT 


TCA 


GCT 


CAG 


GGC 


AAG 


TAC 


AAA 


GCC 


TTC 


TCC 


ACC 


TGT 


GCA 


TCT 


384 


CAC 


CTC 


TCC 


GTG 


GTC 


TCC 


TTA 


TTT 


TAT 


TGT 


ACA 


AGC 


CCG 


GGT 


GTG 


TAC 


432 


CTC 


AGT 


TCT 


GCT 


GTG 


ACC 


CAA 


AAC 


TCA 


CAC 


TCC 


ACT 


GCA 


ACT 


GCC 


TCG 


480 


GTG 


ATG 


TAC 


AGC 


GTG 


GTC 


ACC 


CCC 


ATG 


CTC 


AAC 


CCC 


TTT 


ATC 


TGC 


AGT 


528 



(34) INFORMATION POUR LA SEQ ID NO: 33 : 

(i) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 528 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(ix) CARACTERI STIQUES 

(A) NOM/CLE: AMOR 10 



FEUILLE DE R EMPLACEMENT (REGLE 26) 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 33 



CAA GCT TTG GCG TAC GAC 
TAT CCC AGA ATC ATG AGT 
TCC TGG GTC TTA TCC TCT 
GCC CGT CTC" TCT TTC CTT 
GAT CTC TCT GCG TTA CTC 
CAG CTG GCT ATT CTC ACG 
ATG TGC ATT CTG GTC TCA 
AGA CCC TCC CTC AAG GGC 
CAC CTC TCT GTG GTC TCT 
ATT GTC CCC TCA TCT AAT 
GTG TTG TAT ACT CTG GTC 



AGG TTT 
CAG AAC 
GCC AAT 
AGA GGC 
AAG CTA 
GCA GGA 
TAT GGC 
ATC TGC 
GTG TAC 
AGC ACT 
ATC CCC 



GTG 
CTC 
GCC 
ATC 
TCC 
TCA 
CAC 
AAA 
TAT 
AAT 
ATG 



GCC 
TGT 
CTT 
ACT 
AGC 
GCA 
ATT 
GCC 
GGA 
GAC 
CTC 



ATC 
TTC 
TTG 
CTG 
TCT 
GTT 
GGG 
TTA 
GCA 
AAG 
A*C 



TGT CAC 
CTG CTA 
CAC ACC 
CCC CAC 
GAC ACC 
GTT ACC 
GCC ACC 
TCC ACA 
GTT ATT 
GAT ATT 
CCC TTC 



CCA CTG CAT 
GTG GTT GTG 
CTC CTC CTA 
TTC TTC TGT 
ACC ATC AAT 
CTG CCA TTC 
ATC CTG AGA 
TGT GGC TCC 
GCA CTC TAT 
GCT GTG TCT 
ATC TGC AGT 



48 
96 
144 
192 
240 
288 
336 
384 
432 
480 
528 



(35) INFORMATION POUR LA SEQ ID NO: 34 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 528 

(B) TYPE: acide nucleique 

(C) NOKBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
( ix ) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 11 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO:34 ; 

CAA GCT TTG GCG TAT GAT AGG TTC TTG GCC ATC TGT TAT CCC CTG CAT 48 

TAT ACA GTC ATT ATG AAC CCT CGC CTC TGT GGC TTC TCA ATT TTG GTA 96 

TCA TTT TTG CTG AGT CTC TTG GAC TCT CAG CTG CAC AAT TTG ATG ATC 144 

TTA CAA ATT ACC AGT TTC AAG GAT GTG GAA ATT TCT AGT TTC TTC TGT 192 

GAC CCT TCT CAA CTT CTG AAT CTT TCC TGT TCT GAC AAC TAC TCT ATT 240 

AAT ACT GGC AAG TAT GTT CTT TTT GCC CTA TAT AGC TTT TTC CCC ATC 2 88 

TCA GGG ATC CTT TTC TCT TAC TAT AAA ATA ATT TCC TCC ATT CTG AGG 336 

ATC CCA TCC TCA GGG GGG AAG TAC AAA GCC TTC TCC ACT TGT GGC TCT 3 84 

CAC CTG GCA GTT TTT TGC CTA TTT TTA GGA ACA GGT ACT GCA GTG TAC 432 

TTT GGA TCA GCT GTA TCA CAT TCT CCC AGG GAG AAT GTG GTG TCC TCA 4 80 

GTA ATG TAT ACT GTG GTC ACC CCC ATG CTC AAT CCC TTT ATC TGC AGT 528 



(3 6) INFORMATION POUR LA SEQ ID NO: 35 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 528 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 12 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO:35 : 



FEUILLE DE REMPLACEMENT (REGLE 26) 



CAA 


GCT 


TTG 


GCG 


TAT 


GAC 


AGG 


TTT 


GTG 


GCC 


ATC 


TGT 


CAC 


CCC 


CTG 


CAT 


48 


TAT 


CCA 


ACC 


ATT 


ATG 


AAC 


CCT 


CGA 


TTT 


TGT 


GGC 


TTT 


TTA 


GTT 


TTG 


GTG 


96 


TCT 


TTT 


TTG 


GTT 


AGC 


CTT 


TTG 


GAA 


TCC 


CAG 


CTG 


CAC 


AAT 


TTG 


ATT 


GCA 


144 


TTA 


CAG 


TTT 


ACT 


ACT 


TTC 


AAA 


GAT 


GTA 


AAA 


ATT 


GCT 


AAT 


TTT 


TTC 


TGT 


192 


GAC 


CCT 


TCT 


CAG 


GTC 


CTC 


AGT 


CTT 


TCC 


TGT 


TCT 


GGC 


ACC 


TTC 


ATC 


AAT 


240 


ATC 


ATA 


GTA 


ATG 


TAT 


TTT 


GTT 


GGT 


GCT 


CTA 


TTT 


GGT 


GTT 


TTT 


CCC 


ATC 


288 


TCA 


GGA 


ATC 


CTT 


TTC 


TCT 


TAC 


TAT 


AAA 


ATA 


GTT 


TCC 


ACT 


ATT 


CTG 


AGA 


336 


ATC 


CCA 


TCC 


TCA 


GGT 


GGG 


AAA 


TAT 


AAA 


GCC 


TTC 


TCT 


ACC 


TGT 


GGG 


TCT 


384 


CAC 


CTA 


TCA 


GTT 


GTT 


TGT 


TTA 


TTT 


TAT 


GGA 


ACA 


GGC 


TTT 


GGA 


GTG 


TAC 


432 


CTT 


GGT 


TCA 


GCT 


GTG 


TCA 


CAT 


TCT 


TCT 


AGA 


AAA 


TCT 


GCA 


GTG 


GCC 


TCG 


480 


GTG 


ATG 


TAC 


ACA 


GTT 


GTC 


ACC 


CCC 


ATG 


CTC 


AAC 


CCC 


TTC 


ATC 


TGC 


AGT 


528 




(37) 


INFORMATION POUR 


LA 


SEQ 


ID 


NO: 


36 











(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 504 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
( ix ) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 13 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 36 : 



GGG 


GCC 


ATT 


CGC 


TTT 


CCC 


CTG 


CAC 


AAT 


ACT 


ACC 


ATC 


ATG 


AGC 


CCC 


AAG 


48 


CTC 


GGT 


CTC 


TTC 


CTG 


GTG 


GTG 


CTG 


TCC 


TGG 


GTG 


CTA 


ACC 


ATG 


TTC 


CAT 


96 


GCC 


ATG 


CTC 


CAT 


ACC 


CTG 


CTT 


ATG 


GCC 


AGA 


TTG 


TGT 


TTC 


TGT 


GCA 


GAG 


144 


AAC 


ATG 


ATT 


CCC 


CAT 


TTT 


TTC 


TGT 


GAT 


ATG 


TCT 


GCC 


CTT 


CTG 


AAG 


CTG 


192 


TCC 


TGC 


TCC 


AAC 


ACT 


CAT 


GTC 


AAT 


GAG 


TTG 


GTG 


ATA 


TTC 


ATC 


ACA 


GCA 


240 


GGC 


CTC 


ATT 


CTT 


CTC 


ATT 


CCA 


TTG 


GTC 


CTC 


ATT 


CTT 


CTT 


TCC 


TAT 


GGG 


288 


CAC 


ATC 


GTG 


TCC 


TCC 


ATT 


CTC 


AAG 


GTC 


CCT 


TCT 


GCT 


CGA 


GGT 


ATC 


CAT 


336 


AAG 


ACC 


TTC 


TCC 


ACC 


TGT 


GGC 


TCC 


CAT 


TTG 


TCT 


GTG 


GTG 


TCA 


CTG 


TTC 


384 


TAT 


GGG 


ACA 


GTC 


ATC 


GGA 


CTC 


TAC 


TTA 


TGT 


CCA 


TCA 


GCT 


AAT 


AAT 


TCT 


432 


ACT 


GTG 


AAA 


GAT 


ACT 


GTC 


ATG 


GCT 


CTG 


ATG 


TAC 


ACG 


GTG 


GTC 


ACT 


CCC 


480 


ATG 


CTC 


AAT 


CCC 


TTT 


ATC 


TGC 


AGT 


















504 



(38) INFORMATION POUR LA SEQ ID NO: 37 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 528 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 14 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 37 : 

CAA GCT TTG GCG TAT GAC AGA TTC CTG GCC ATA TGT CAC CCA CTG CAC 48 
TAC ACT GCC ATC ATG AAT CCC AGG CTC TGT GGT TTG CTG GTT CTG GTG 96 



FEUILLE DE REMPLACEMENT (REGLE 26) 



TGC TGG ATC CTG AGT GTC CTG CAT 
TTG CGA CTG TCC TTC TGC AG A GAC 
GAA CTC AAC CAG GTG GTC CAA CTT 
GAC ATA GTG ATG AAT TTT GCA CTT 
GCT GGC ATT CTT TAC TCC TAC TCC 
ATC TCT TCA GCT CAG GGC AAG TAC 
CAC CTC TCT GTG GTC TCC TTA TTT 
CTC AGT TCT GCT GTA TCC CAC AGC 
GTG ATG TAC ACC GTG GTC ACC CCC 



GCC TTG TTG CAA AGC 
ATA GAA ATC CCC CAT 
GCC TGT TTT GAC AAC 
GTG CTC TTG GCT ACT 
AAG ATA GTC TCC TCC 
AAA GCC TTT TCC ACC 
TAC TGC ACA GGC CTG 
TCA CGC TCC AGT GCA 
ATG CTC AAC CCC TTC 



TTA ATG 
TTT TTC 
CTT CTT 
TGT CCC 
ATC CGT 
TGT GCC 
GGT GTG 
ACA GCC 
ATC TGC 



GTG 
TGT 
AAT 
CTC 
GCA 
TCC 
TAC 
TCA 
AGT 



144 
192 
240 
286 
336 
384 
432 
480 
528 



(39) INFORMATION POUR LA SEQ ID NO: 38 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 357 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 15 

<xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 38 : 

CAC CTT TGC AGG TTG CAT CTC ACA GTC CTC AAG CTC GCC TGC TCT GAC 4 8 

ACC CTC ATC AAC AAC ATA GTG GTG TTC TCT ATG ATC ATC GTC CTG GGT 96 

GTC TTC CCT CTC AGT GGC ATC CTC TTC TCC TAC TCT CAG ATT TTC TCC 144 

TCC ATC CTG AGG ATC TCA TCA GAC AGA GGC AAG TAC AAA GTC TTC TCC 192 

ACC TGT GGG TCT CAC CTC CTG GTG GTC TCC TTG TTC TAT GGC AGT AGC 240 

CTT GGG GTC TAC CTC AGT TCT GTA GCC ACA CTG TCT TCT AGG ATG ACT 288 

CTG ATG GCC TCA GTG ATG TAC ACC ATG GTC ACC CCC ATG CTG AAC CCC 3 36 

ATC ATC TAC ACC CTC CGG AAC 357 



(40) INFORMATION POUR LA SEQ ID NO: 39 : 



(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 477 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
( ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 16 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 39 : 



CCC 
ACA 
GCC 
CTA 
TTC 
AGA 
GTA 
TCC 



ATG 
TCC 
ATC 
GCC 
TTG 
TGG 
GAT 
AAT 



TAC TTG 
ACA GTG 
TCT GTG 
ACA GCA 
GCA ATC 
TGC ATG 
GAA TTA 
CGC ATC 



TTC CTC GGT 
GTG CCG AAA 
ACT GGT TGC 
GAA TGC TTC 
TGC TAC CCA 
GGG CTG GTG 
GTT GTG GTC 
GAT CAC TTT 



AAT TTG TCC TTC CTG GAG ATC CTT 
ATG CTG GAG GGC TTC CTG CAG GTG 
TTG ACC CAG TTC TTC ATC TTT GGT 
CTA CTG GCT GTT ATG GCA TAT GAT 
CTT CGC TAT CCA CTC CTG ATG GGG 
GTC ACA GCC TGG CTG TCT GGC TTC 
CTG ATG GCC CAG CTG AGG TTC TGT 
TAC TGT CAC TTC ATG CCT TTG GTG 



TAT 
GCA 
TCT 
CGC 
CCT 
ATG 
GGC 
GTC 



48 
96 
144 
192 
240 
288 
336 
384 



FEUILLE 



DE REMPLACEMENT (REGLE 26) 



CTG GCT TGC TCA GAT CCC CGA GTA GCC CAG GTG ACA ACA TTT GTT CTC 
TCT GTA GTC CCC CTC ACT GTT CCA TTC GGA CTG ATT CTG ACA TCC 



432 
477 



(41) INFORMATION POUR LA SEQ ID NO: 40 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 339 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 17 







(xi) 


DESCRIPTION 


DE LA SEQUENCE: SEQ 


ID 


NO: 40 ; 




GAG 


GAT 


CTA 


TGT 


GCG 


AGA 


CTC 


AAG 


CGA 


TCC 


AGG 


TCG 


GAC 


ACC 


ACC 


ATC 


48 


AAT 


GAG 


GTG 


GGT 


ATT 


CTC 


ACG 


GCA 


GGA 


TCA 


GCA 


GTT 


GTT 


ACC 


CTG 


CCA 


96 


TTC 


ATG 


TGC 


ATT 


CTG 


GTC 


TCA 


TAT 


GGC 


CAC 


ATG 


GGG 


GCC 


ACC 


ATC 


CTG 


144 


AGA 


AGA 


CCC 


TCC 


CTC 


AAG 


GGC 


ATG 


TGC 


AAA 


GCC 


TTA 


TCC 


ACA 


TGT 


GGC 


192 


TCC 


CAC 


CTC 


TGT 


GTG 


GTC 


TCT 


GTG 


TAC 


TAT 


GGA 


GCA 


GTT 


ATT 


GCA 


CTC 


240 


TAT 


ATT 


GTC 


CCC 


TCA 


TCT 


AAT 


AGC 


ACT 


AAT 


GAC 


AAG 


GAT 


ATT 


GCT 


GTG 


288 


TCT 


GTG 


TTG 


TAT 


ACT 


CTG 


GTC 


ATC 


CCC 


ATG 


CTC 


AAC 


CCC 


TTC 


ATC 


TGC 


336 


AGT 
































339 



(42) INFORMATION POUR LA SEQ ID NO: 41 : 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 528 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: AMOR 18 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 41 : 



CAA 
TAT 
TCA 
TTA 
GAC 
AAC 
TCA 
ATC 
CAC 
CTT 
CTG 



GCT 
CTG 
TTT 
AAT 
CCT 
ATT 
GGG 
CCC 
CTG 
GGA 
ATG 



TTG GGG 
GTC ATT 
TTG CTG 
ATT ACC 
TCT CAA 
GTC AAG 
ATC CTT 
TCC TTA 
GCA GTT 
TCA GTT 
TAC ACT 



TAT GAT AGA TTT GTG 
ATG AGC CCT CGC CAT 
AGT CTT TTG GAC TCC 
AGC TTC AAG GAT GTG 
CTG CTG AAT CTC TCC 
TAT TTT CTG GGA GCC 
TTC TCT TAC TAC AAA 
GGT GGG AAG TAC AAA 
GTT TGC TTA TTT TTA 
GCA TCA CAT TCT CCC 
GTG GTC ACC CCC ATG 



GCC 
GGT 
CAG 
GAA 
TGT 
TTC 
ATT 
GCC 
GTG 
AGA 
CTC 



ATG 
GGC 
CTG 
ATT 
TCC 
TAT 
ATT 
TTC 
ACA 
AAT 
AAC 



TGT CAT 
TTC CTA 
CAC AGT 
TCT AAT 
AAC ACC 
GGC CTT 
TCC TCC 
TCC ACC 
GCC TCC 
GAT GTG 
CCC TTC 



CCT GGG CAG 
ACT TTG GTG 
TTC ATG ACC 
TTC TTC TGT 
TTC TCT GAT 
TTT CCC ATC 
ATT CTG AGG 
TGT GGG TCT 
ACA GTG TAC 
GTG GCT TCT 
ATC TGC AGT 



48 
96 
144 
192 
240 
288 
336 
384 
432 
480 
528 



(43) INFORMATION POUR LA 



SEQ 



ID 



NO: 42 



FEUILLE DE REMPLACEMENT (REGLE 26) 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 528 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 19 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 42 : 



CAA 


GCT 


TTG 


GCG 


TAT 


GAC 


AGA 


TTT 


CTG 


GCC 


ATC 


TGT 


CAT 


CCT 


CTG 


CAT 


48 


TAT 


CTG 


GTC 


ATT 


ATG 


AGC 


CCT 


CGC 


CAT 


TGT 


GGC 


TTC 


TTA 


ACT 


TTG 


GTG 


96 


TCA 


TTT 


TTG 


CTG 


AGT 


CTT 


TTG 


GAC 


TCC 


CAG 


CTG 


CAC 


AGT 


TTC 


ATG 


ACC 


144 


TTA 


AAT 


ATT 


ACC 


AGC 


TTC 


AAG 


GAT 


GTG 


GAA 


ATT 


TCT 


AAT 


TTC 


TTC 


TGT 


192 


GAC 


CCT 


TCT 


CAA 


CTG 


CTG 


AAT 


CTC 


TCC 


TGT 


TCC 


AAC 


ACC 


TTC 


TCT 


GAT 


240 


AAC 


ATT 


GTC 


AAG 


TAT 


TTT 


CTG 


GGA 


GCC 


TTC 


TAT 


GGC 


CTT 


TTT 


CCC 


ATC 


288 


TCA 


GGG 


ATC 


CTT 


TTC 


TCT 


TAC 


TAC 


AAA 


ATT 


ATT 


TCC 


TCC 


ATT 


CTG 


AGG 


336 


ATC 


CCC 


TCC 


TTA 


GGT 


GGG 


AAG 


TAC 


AAA 


GCC 


TTC 


TCC 


ACC 


TGT 


GGG 


TCT 


384 


CAC 


CTG 


GCA 


GTT 


GTC 


TGC 


TTA 


TTT 


TTA 


GTG 


ACA 


GCC 


TCC 


ACA 


GTG 


TAC 


432 


CTT 


GGA 


TCA 


GTT 


GCA 


TCA 


CAT 


TCT 


CCC 


AGA 


AAT 


GAT 


GTG 


GTG 


GCT 


TCT 


480 


CTG 


ATG 


TAC 


ACT 


GTG 


GTC 


ACC 


CCC 


ATG 


CTC 


AAC 


CCC 


TTT 


ATC 


TGC 


AGT 


528 



(44) INFORMATION POUR LA SEQ ID NO: 43 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 528 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 20 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 43 : 



CAA 


GCT 


TTG 


GCG 


TAT 


GAC 


AGG 


TTC 


CTG 


GCC 


ATC 


TGT 


CAT 


CCT 


CGG 


CAT 


48 


TAT 


CTG 


GTC 


ATT 


ATG 


AGC 


CCT 


CGC 


CAT 


TGT 


GGC 


TTC 


TTA 


ACT 


TTG 


GTG 


96 


TCA 


TTT 


TTG 


CTG 


AGT 


CTT 


TTG 


GAC 


TCC 


CAG 


CTG 


CAC 


AGT 


TTC 


ATG 


ACC 


144 


TTA 


AAT 


ATT 


ACC 


AGC 


TTC 


AAG 


GAT 


GTG 


GAA 


ATT 


TCT 


AAT 


TTC 


TTC 


TGT 


192 


GAC 


CCT 


TCT 


CAA 


CTG 


CTG 


AAT 


CTC 


TCC 


TGT 


TCC 


AAC 


ACC 


TTC 


TCT 


GAT 


240 


AAC 


ATT 


GTC 


AAG 


TAT 


TTT 


CTG 


GGA 


GCC 


TTC 


TAT 


GGC 


CTT 


TTT 


CCC 


ATC 


288 


TCA 


GGG 


ATC 


CTT 


TTC 


TCT 


TAC 


TAC 


AAA 


ATT 


ATT 


TCC 


TCC 


ATT 


CTG 


AGG 


336 


ATC 


CCC 


TCC 


TTA 


GGT 


GGG 


AAG 


TAC 


AAA 


GCC 


TTC 


TCC 


ACC 


TGT 


GGG 


TCT 


384 


CAC 


CTG 


GCA 


GTT 


GTT 


TGC 


TTA 


TTT 


TTA 


GTG 


ACA 


GCC 


TCC 


ACA 


GTG 


TAC 


432 


CTT 


GGA 


TCA 


GTT 


GCA 


TCA 


CAT 


TCT 


CCC 


AGA 


AAT 


GAT 


GTG 


GTG 


GCT 


TCT 


480 


CTG 


ATG 


TAC 


ACT 


GTG 


GTC 


ACC 


CCC 


ATG 


CTC 


AAT 


CCC 


TTC 


ATC 


TGC 


AGT 


528 



(45) INFORMATION POUR LA SEQ ID NO: 44 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 



FEUILLE DE REMPLACEMENT (REGLE 26) 



(A) LONGUEUR: 3 36 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN : double 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADN 

(ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 21 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 44 

CCC ATG TAT TTG TTT CTC GGT AAC CTG TCC TTC ATG GAC ATC TGC TTC 

ACA ACA GTC GTT GTG CCC AAG ATG CTG GCG AAT TTG CTG TCA GAG ACA 

AAG GGC ATC TCC TAT GTA GGC TGC CTG GTC CAG ATG TAT TTC TTC ATG 

GCC TTT GGG AAC ACT GAT AGT TAC CTG CTG GCC TCC ATG GCC ATC GAC 

CGG CTG GTG GCC ATC TGC AAC CCC TTG CAC TAT GAT GTG GCC ATG CGC 

CCA CAC CGC TGC CTC CTC ATG CTG CTG GGT TC? TGC ACC ATC TCC CAC 

CTG CAC GCC CTC TTC CGG GTG CTA CTC ATG TCT CGC CTC TCT TTC TGT 



(46) INFORMATION POUR LA SEQ ID NO: 4 5 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3 57 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: AMOR 22 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 45 

CAC CTT TGC AGG TTG CAT CTC ACA GTC CTC AAG CTC GCC TGC TCT GAC 
ACC CTC ATC AAC AAC ATA GTG GTG TTC TCT ATG ATC ATC GTC CTG GGT 
GTC TTC CCT CTC AGT GGC ATC CTC TTC TCC TAC TCT CAG ATT TTC TCC 
TCC ATC CTG AGG ATC TCA TCA GAC AGA GGC AAG TAC AAA GTC TTC TCC 
ACC TGT GGG TCT CAC CTC CTG GTG GTC TCC TTG TTC TAT GGC AGT AGC 
CTT GGG GTC TAC CTC AGT TCT GTA GCC ACA CTG TCT TCT AGG ATG ACT 
CTG ATG GCC TCA GTG ATG TAC ACC ATG GTC ACC CCC ATG CTG AAC CCC 
ATT ATC TAC ACC CTC CGG AAC 



(47) INFORMATION POUR LA SEQ ID NO: 46 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 423 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(ix) CARACTERISTIQUES 

(A) NOM/CLE: AMOR 23 
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(xi) DESCRIPTION 

TGG AGT CTT TTG GAG TCC CAG CTG 
ACC AGC TTC AGG GAT GTG GAA AGT 
CAA ATG CTG AAT CTC TCC TGT TCC 
AAG TAT TTT CTG GGA GCC TTC TAT 
CTT TTC TCT TAC TAC AAA ATT ATT 
TTA GGT GGG AAG TAC AAA GCC TTC 
GTT GTT TGC TTA TTT TTA GTG AC A 
GTT GCA TCA CAT TCT CCC AGA AAT 
ACT GTG GTC ACC CCC ATG CTC AAC 



DE LA SEQUENCE : SEQ ID NO: 46 

CAC AGT TTG AGG ACC TTA AAT ATG 
TCT AAT TTG TTG TGT GAC CCT TCT 
AAC ACC TTC TCT GAT AAC ATT GTC 
GGC CTT TTT CCC ATC TCA GGG ATC 
TCC TCC ATT CTG AGG ATC CCC TCC 
TCC ACC TGT GGG TCT CAC CTG GCA 
GCC TCC ACA GTG TAC CTT GGA TCA 
GAT GTG GTG GCT TCT CTG ATG TAC 
CCC TTT ATC TGC AGT 
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